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内 容 提 要 
本 书 将 带领 读者 从 头 开始 制作 一 门 语言 的 编译 器 。 笔 者 特意 为 本 书 设 计 了 Cb 语言 , Cb 可 以 说 是 





指针 运算 等 在 内 的 C 语 言 的 主要 部 分 。 本 
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的 编译 器 ， 是 实 实在 在 的 编译 器 , 而 非 有 诸多 限 
中 心 的 编程 语言 的 运行 环境 , 即 编译 器 、》 
程序 运行 的 所 有 环节 。 
从 单纯 对 编译 器 感 兴趣 的 读者 至 
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用 为 目的 的 读者 , 都 适合 阅读 本 书 。 
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所 实现 的 编译 器 就 是 Cb 语言 
所 的 玩具 。 另 外, 除 编译 器 之 外 , 本 书 对 以 编译 器 为 
F、 运 行 时 环境 等 都 有 所 提 及 , 介 


2H f 











算 上 这 本 《自制 编译 器 》 图 灵 的 “自制 ”系列 应 该 已 经 有 6 本 了 。 从 CPU 到 操作 系统 ， 从 
编译 器 到 编程 语言 ， 再 到 搜索 引擎 等 具体 的 应 用 ， 例 然 已 经 可 以 自制 一 套 完 整 的 计算 机 体系 了 。 

“自制 ”系列 图 书 都 是 从 日 本 引进 并 翻译 出 版 的 ， 本 人 也 有 幸 读 过 其 中 几 本 。 可 能 有 很 多 读 
者 和 曾经 的 我 一 样 对 “自制 ” 抱 有 疑惑 :在 时 间 就 是 金钱 、 时 间 就 是 生命 的 I 行业 ， 为 什么 会 
存在 这 样 的 自制 风潮 ? 为 什么 要 自制 呢 ? CPU 可 以 用 Intel、AMD ， 操 作 系 统 已 经 有 了 Windows, 
Linux, ERSA T Google、Yahoo， 编 程 语言 及 其 对 应 的 编译 右 、 解 释 器 更 是 已 经 百花 齐 
放 、 百 家 争鸣 ……” 直 到 翻译 完 本 书 ， 我 才 逐 渐 体会 到 自制 是 最 好 的 结合 实践 学 习 的 方式 之 一 。 
拿 来 的 始终 是 别人 的 ， 要 吃透 某 项 技术 、 打 破 技 术 垄 断 ， 最 好 的 方法 就 是 自制 。 并 且 从 某 种 程度 
上 来 说 ， 自 制 也 是 一 种 创新 ， 可 能 下 一 个 Google 或 Linux 就 孕育 在 某 次 自制 之 中 。 

自制 编译 咒 的 目的 是 了 解 当 前 实用 的 编程 语言 、 编 译 器 和 OS 的 相关 知识 ， 绝 对 不 能 闭 门 
造 车 。 因 此 作者 使 用 的 Cb 语言 是 C 语言 的 子 集 ， 实 现 了 包括 指针 运算 在 内 的 C 语言 的 主要 部 
分 ,通过 自制 一 个 Cb 语言 的 编译 器 ， 能 够 让 我 们 了 解 C 语言 程序 编译 、 运 行 背 后 的 细节 ;OS 
选用 Linux， 能 够 让 我 们 知晓 Linux 上 的 链接 、 加 载 和 程序 库 ; 汇编 部 分 采用 最 常见 的 x86 系统 
架构 。 作 者 自制 的 编译 器 cbe 能 够 运行 在 x86 架构 的 任何 发 行 版 本 的 Linux 上 ， 编 译 Cb 代码 并 
生成 可 执行 的 ELF 文件 。 

作者 青木 先后 在 致谢 中 提 到 了 Linux M GNU 工具 等 开源 软件 的 开发 者 。 这 也 是 本 书 的 另 
一 大 特色 : 充分 利用 开源 软件 和 工具 。 从 GCC 到 GNU Assembler 再 到 JavaCC 以 及 Linux， 并 
非 每 一 行 代 码 都 是 自己 写 的 才 算 自制 ， 根据 自己 的 设计 合理 有 效 地 利用 开源 软件 ， 既 可 以 让 我 
们 更 快 地 看 到 自制 的 成 果 ， 又 能 向 优秀 的 开源 软件 学 习 。 如 果 要 深入 学 习 、 人 研究 ， 那 么 开源 软 
件 的 源 代码 以 及 活跃 的 社区 等 都 是 非常 有 帮助 的 。 而 如 果 把 自制 的 软件 也 作为 开源 软件 上 传 到 
Github 上 供 大 家 使 用 ， 并 根据 其 他 开发 者 提出 的 Pull Request 不 断 改进 软件 ， 那 就 更 好 了 。 

最 后 我 要 由 囊 地 感谢 本 书 的 另 一 位 译 者 绝 云 老师 以 及 图 灵 的 编辑 。 还 要 特别 感谢 我 的 外 公 ， 
一 位 毕生 耕耘 于 教育 出 版 行业 的 老 编辑 。 自 己 能 有 幸 参加 翻译 ， 和 从 小 对 出 版 工作 的 耳闻 目 染 
是 密 不 可 分 的 。 
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本 书 有 两 大 特征 : 第 一 ， 实 际 动手 实现 了 真正 的 编译 器 ; 第 二 ,涉及 了 以 往 编译 器 相关 书籍 
所 不 曾 涉及 的 内 容 。 

先 说 第 一 点 。 

本 书 通 篇 讲述 了 “Cb” 这 种 语言 的 编译 器 的 制作 。Cb 基本 上 是 C 语言 的 子 集 ， 并 实现 了 包 
括 指针 运算 等 在 内 的 C 语言 的 主要 部 分 。 因 此 可 以 说 ， 本 书 实现 的 是 实 实在 在 的 编译 器 ， 而 并 
非 有 诸多 限制 的 玩具 。 

更 具体 地 说 ， 本 书 实现 的 Cb 编译 器 是 以 运行 在 x86 系列 CPU 上 的 Linux 为 平台 的 。 之 所 
以 选择 x86 系列 的 CPU， 是 因为 这 是 最 普及 的 CPU， 相 应 的 硬件 非常 容易 找到 。 选 择 Linux 是 
因为 从 标准 库 到 程序 运行 环境 的 代码 都 是 公开 的 ， 只 要 你 有 心 ， 完 全 可 以 自己 分 析 程序 的 结构 。 

可 能 有 些 作者 不 喜欢 把 话题 局 限于 特定 的 语言 或 者 OS， 而 笔者 却 恰恰 更 倾向 于 在 一 开始 就 
对 环境 进行 限定 。 因 为 比 起 一 般 化 的 说 明 ， 从 具体 的 环境 出 发 ， 再 向 一 般 化 扩展 的 做 法 要 简单 、 
直观 得 多 。 笔 者 赞成 最 终 把 话题 往 一 般 化 的 方向 扩展 ,但 并 不 赞成 一 开始 就 一 定 要 做 到 一 般 化 。 
再 说 第 二 点 。 

本 书 并 不 局 限于 书 名 中 的 “编译 器 ”， 对 以 编译 需 为 中 心 的 编程 语言 的 运行 环境 ， 即 编译 
器 、 汇 编 器 、 链 接 器 、 硬 件 、 运 行 时 环境 都 有 所 涉及 。 
编译 器 生成 的 程序 的 运行 不 仅 和 编译 器 相关 ， 和 汇编 器 、 链 接 咒 等 软件 以 及 硬件 都 密切 相 
关 。 因 此 ， 如 果 想 了 解 编译 器 以 及 程序 的 运行 结果 ， 对 上 述 几 部 分 内 容 的 了 解 当 然 是 必 不 可 少 
的 。 不 过 这 里 的 “当然 ”现在 看 起 来 也 逐渐 变 得 没 那么 绝对 了 。 

只 讲 编译 器 或 者 只 讲 汇编 语言 的 书 已 经 多 得 伴 大 街 了 ， 只 讲 链 接 器 的 书 也 有 一 些 ， 但 是 
穿 上 述 所 有 内 容 的 书 至 今 还 没有 。 写 编译 器 的 书 ， 一 涉及 具体 的 汇编 语言 ， 就 会 注 上 “请 参考 
其 他 书籍 ”; 写 汇编 语言 的 书 ， 对 于 OS 的 运行 环境 问题 却 只 字 不 提 ; 写 链 接 器 的 书 ， 如 果 读 者 
不 了 解 编 译 器 等 相关 知识 ， 也 就 只 能 被 束之高阁 了 。 

难道 就 不 可 能 完整 地 记述 编程 语言 的 运行 环境 吗 ? 笔者 认为 是 可 能 的 。 只 要 专注 于 具体 的 
语言 、 上 共 体 的 OS 以 及 具体 的 和 硬件， 就 可 以 对 程序 运行 的 所 有 环节 进行 说 明了 。 基 于 这 样 的 想 
法 ， 笔 者 进行 了 稍 显 鲁 医 的 尝试 ， 并 最 终 写 成 了 本 书 。 

以 上 就 是 本 书 的 基本 原则 。 下 面 是 本 书 的 读者 对 象 。 
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v | 前 言 





e 想 了 解 编译 器 和 解释 器 内 部 结构 的 人 

e 想 了 解 C 语言 程序 运行 机 制 的 人 

e 想 了 解 x86 CPU ( Pentium gk Intel Core, Operon 等 ) 的 结构 的 人 

e 想 了 解 Linux 上 的 链接 、 加 载 和 程序 库 的 人 

e 想 学 习 语法 分 析 的 人 

e 想 设 计 新 的 编程 语言 的 人 

综 上 ， 本 书 是 一 本 基于 具体 的 编程 语言 、 具 体 的 硬件 平台 以 及 具体 的 OS 环境 ,介绍 程序 
运行 的 所 有 环节 的 书 。 因 此 ， 从 单纯 对 编译 器 感 兴趣 的 读者 到 以 实用 为 目的 的 读者 ， 都 适合 阅 
BET. 


必要 的 知识 

本 书 的 读者 需要 具备 以 下 知识 。 

€ Java 语言 的 基础 知识 

e C 语言 的 基础 知识 

€ Linux 的 基础 知识 
本 书 中 制作 的 Cb 编译 器 是 用 Java 来 实现 的 ， 所 以 能 读 懂 Java 代码 是 阅读 本 书 的 前 提 条 件 。 
不 只 是 语言 ， 书 中 对 集合 等 基本 库 也 都 没有 任何 说 明 ， 因 此 需要 读者 具备 相关 的 知识 储备 。 
本 书 所 使 用 的 Java 版 本 是 $.0。 关 于 泛 化 (generics ) 和 foreach 语句 等 Java 5 特有 的 功能 ， 
在 第 一 次 出 现时 会 进行 简单 的 说 明 。 

另外 ， 之 所 以 需要 读者 具有 C 语言 的 基础 知识 ， 是 因为 Cb 语言 是 C 语言 的 子 集 ， 另 外 ， 
以 C 语言 的 知识 为 基础 ， 对 汇编 器 的 理解 也 将 变 得 容易 得 多 。 不 过 读者 不 需要 次 究 细 节 ， 只 要 
能 够 理解 指针 和 结构 体 可 以 组 合 使 用 这 种 程度 就 足够 了 。 

最 后 ， 关 于 shell 的 使 用 方法 以 及 Linux 方面 的 常识 ， 这 里 也 不 作 介绍 。 例 如 ced, 1s, cp, 
mv 等 基本 命令 的 用 法 ， 都 不 会 进行 说 明 。 


[F3 不 必要 的 知识 
本 书 的 读者 不 需要 具备 以 下 知识 。 


o 编译 器 和 解释 器 的 构造 
e 解析 器 生成 器 的 使 用 方法 
e 操作 系统 的 详细 知识 
e 汇编 语言 

e 硬件 知识 

















































































































前 € | vi 


即使 读者 对 编译 器 和 解释 需 的 构造 一 无 所 知 ， 也 没有 关系 ， 本 书 会 对 此 进行 详尽 的 说 明 。 
23h, OS 及 CPU 相关 的 前 提 知 识 也 基本 不 需要 。 能 用 Linux 的 shell 进行 文件 操作 ， 用 
gcc 命令 编译 C 语言 的 “Hello,World” 程 序 ， 这 样 就 足够 了 。 


本 书 的 结构 






























































































































































































































































































































































































































































本 书 由 以 下 章节 构成 。 

章 内 容 

第 1 始 制作 编译 器 本 书 概要 以 及 了 解 编译 器 所 需要 的 基础 知识 

第 2 章 Cb 和 和 cbc 本 书 制作 的 Cb 编译 器 的 概要 

第 1 部 分 代码 分 析 

第 3 章 语法 分 析 的 概要 语法 分 析 的 概念 及 方法 

第 4 章 词法 分 析 cbc 的 词法 分 析 ( 扫描 ) 

第 5 JavaCC 的 解析 器 的 描述 JavaCC 的 使 用 方法 ( 语法 部 分 ) 

第 6 章 语法 分 析 cbc 的 语法 分 析 

第 2 部 分 象 语法 树 和 中 间 代 码 

第 7 章 JavaCC 的 action 和 抽象 语法 树 JavaCC 的 使 用 方法 ( action 部 分 ) 

第 8 章 象 语法 树 的 生成 根据 语法 分 析 的 结果 生成 语法 树 的 方法 

第 9 章 语义 分 析 ( 1 ) 引用 的 消解 变量 的 引用 和 具体 定义 之 间 的 消解 

第 10 章 语义 分 析 ( 2 ) 静态 类 型 检查 编译 时 的 类 型 检查 

第 11 章 中 间 代 码 的 转换 从 抽象 语法 树 生成 中 间 代 码 

$6 3 Sp 汇编 代码 

第 12 章 x86 架构 的 概要 H Intel 系列 CPU 的 系统 的 构造 

第 13 章 x86 汇编 器 编程 x86 CPU 的 汇编 语言 的 读 法 

第 14 章 函数 和 变量 x86 CPU 架构 中 函数 调用 的 形式 

第 15 章 编译 表达 式 和 语句 和 栈 帧 无 关 的 汇编 代码 的 生成 

第 16 章 分 配 栈 帧 和 栈 帧 相关 的 汇编 代码 的 生成 

第 17 章 优化 的 方法 优化 程序 的 方法 的 概 

第 4 部 分 | 链接 和 加 载 

第 18 章 生成 目标 文件 ELF 文件 的 构造 和 生成 

第 19 章 链接 和 库 链接 的 种 类 和 库 

第 20 章 加 载 程序 内 存 中 程序 的 加 载 及 动态 链接 

第 21 章 生成 地 址 无 关 代 码 地 址 无 关 代 码 及 共享 库 的 生成 

第 22 章 扩展 阅读 为 读者 的 后 续 学 习 介绍 相关 知识 
编译 器 自身 也 是 一 款 程 序 ， 它 将 程序 的 代码 逐次 进行 转换 ， 最 终生 成 可 以 运行 的 文件 。 因 

















此 前 面 音节 的 内 容 会 成 为 后 续 音 节 的 前 提 ， 推 荐 从 头 开始 依次 阅读 本 书 的 所 有 章 。 
但 是 ， 如 果 你 对 编译 器 有 一 定 程 度 的 了 解 ， 并 且 只 对 特定 的 话题 感 兴趣 ， 也 可 以 选取 相应 
的 章节 来 阅读 。 本 书 做 成 的 Cb 编译 需 可 以 显示 每 个 阶段 生成 的 数据 结构 ， 因 此 你 也 可 以 实际 和 运 
fT— F Cb 编译 澡 ， 一 边 确认 前 一 阶段 生成 的 结果 ， 一 边 往 下 阅读 。 

例如 ， 即 使 跳 过 语法 分 析 的 章节 ， 只 要 用 - -dump-ast 选项 显示 前 一 阶段 生成 的 抽象 语法 


















































树 ， 就 可 以 理解 下 一 阶段 的 语义 分 析 和 中 间 代 码 的 相关 内 容 。 同 样 ， 还 可 以 用 - -dump- ir 3 
项 显示 中 间 人 代码, 用 --dump-sam 选项 显示 汇编 代码 。 
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开始 制作 编译 器 


本 章 先 讲述 本 书 以 及 编译 器 的 概要 ， 之 后 说 明 本 
书 的 示例 程序 Cb 的 安装 方法 。 


IR] 
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这 节 将 对 本 书 的 概要 进行 说 明 。 


本 书 的 主题 


本 书 的 主题 是 编译 器 。 编 译 器 (compiler) 是 将 编程 语言 的 代码 转换 为 其 他 形式 的 软件 。 这 
种 转换 操作 就 称 为 编译 (compile )。 

实际 的 编译 器 有 C 语言 的 编译 器 GCC (GNU Compiler Collection ), Java 语言 的 编译 器 
javac ( Sun 公司 ) 等 。 

像 编 译 吉 这 样 复 杂 的 软件 ， 仅 仅 笼统 地 介绍 一 下 是 很 难 让 人 理解 的 ， 所 以 本 书 将 从 头 开始 
制作 一 门 语言 的 编译 器 。 通 过 实际 地 设计 、 制 作 编译 器 ， 使 读者 对 编译 器 产生 具体 、 深 刻 的 认 
识 。 这 样 通过 实践 获得 的 知识 ， 在 其 他 语言 的 编译 器 上 也 是 通用 的 。 


本 书 制作 的 编译 器 


本 书 将 从 头 开始 制作 Cb" 这 门 语言 的 编译 器 。 

Cb 是 笔者 为 本 书 设 计 的 语言 ， 基 本 上 可 以 说 是 C 语言 的 子 集 。 它 在 C 语言 的 基础 上 进行 了 
简化 ， 并 加 入 了 一 些 时 兴 的 功能 ， 使 得 与 之 配套 的 编译 器 制作 起 来 比较 容易 。 笔 者 最 初 想 直接 
使 用 C 语言 的 ， 但 是 C 语言 的 编译 器 无 论 写 起 来 还 是 读 起 来 都 非常 难 ， 所 以 最 终 放弃 了 。 关 于 
Cb 的 标准 ， 第 2 章 会 详细 说 明 。 

使 用 本 书 的 Cb 编译 器 编译 出 的 程序 是 在 PC 的 Linux 平台 上 运行 的 。 最 近 ， 借 助 虚拟 机 以 
及 KNOPPIX 等 ，Linux 环境 已 经 很 容易 搭建 了 。 请 读者 一 定 要 实际 用 Cb 编译 器 编译 程序 ， 并 


尝试 运行 一 下 。 


编译 示例 


接着 让 我 们 赶紧 进入 编译 天 的 正题 。 
首先 我 们 来 思考 一 下 编译 究竟 是 一 种 什么 样 的 处 理 。 这 里 以 使 用 GCC 处 理 代码 清单 1.1 中 







































































































































































(D 为 降 调 符号 (读音 同 “ 降 ”" )， 表 示 把 基本 音符 音 高 降低 半音 。 





译 者 注 
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的 c 语言 程序 为 例 进 行 说 明 。 实 际 编译 下 面 的 程序 时 ， 需 要 重新 安装 GCC。 
代码 清单 1.1 hello.c 


Hinclude <stdio.h> 














int 

main(int argc, char **argv) 

{ 
printf("Hello, World!Wn"); /* 打 个 招呼 */ 
return 0; 








本 书 的 读者 对 象 是 已 经 掌握 C 语言 知识 的 人 ， 所 以 理应 编译 过 C 语言 程序 。 但 保险 起 见 ， 
还 是 确认 一 下 编译 的 步骤 。 使 用 GCC 处 理 上 述 程序 ， 需 要 输入 如 下 命令 。 























$ gcc hello.c -o hello 





这 样 便 生成 了 名 为 hello 的 文件 ， 这 是 个 可 执行 文件 (executable file )。 
接着 输入 下 面 的 命令 ， 运 行 刚 才 生 成 的 hello 命令 。 





$ ./hello 
Hello, World! 


通过 这 样 操作 来 运行 程序 本 和 刁 没 有 问题 ,但 从 过 程 来 看 ， 还 是 有 一 些 不 明确 的 地 方 。 

e 可 执行 文件 是 怎样 的 文件 

€ gcc 命令 是 如 何 生 成 可 执行 文件 的 

e 可 执行 文件 hello 是 经 过 哪些 步骤 运行 起 来 的 

让 我 们 依次 看 一 下 上 述 疑 问 。 
FJ 可 执行 文件 

首先 从 GCC 生成 的 可 执行 文件 是 什么 说 起 。 

说 到 现代 的 Linux 上 的 可 执行 文件 ， 通 常 是 指 符合 ELF (Executable and Linking Format ) 这 
种 特定 形式 的 文件 。1s 、cp 这 些 命令 (command ) 对 应 的 实体 文件 都 是 可 执行 文件 ， 例 如 
/bin/ls 和 /bin/cp 等 。 


使 用 file 命令 能 够 查看 文件 是 否 符合 ELF 的 形式 。 例 如 ， 要 查看 /bin/ls 文件 是 不 是 
ELF， 在 shell 中 输入 如 下 命令 即 可 。 
























































$ file /bin/ls 
/bin/ls: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), for GNU/Linux 
2.4.1, dynamically linked (uses shared libs), for GNU/Linux 2.4.1, stripped 
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如 果 像 这 样 显示 ELE...... executable， 就 表示 该 文件 为 ELF 的 可 执行 文件 。 根 据 所 
使 用 的 Linux 机 器 的 不 同 ， 可 能 显示 ELF 64-bit， 也 可 能 显示 ELF 32-bit MSB， 这 些 都 是 
ELF 的 可 执行 文件 。 





ELF 文件 中 包含 了 程序 (代码 ) 以 及 如 何 运 行 该 程序 的 相关 信息 (元 数据 )。 程 序 (代码 ) 
就 是 机 器 语言 ( machine language ) 的 列表 。 机 器 语言 是 唯一 一 种 CPU 能 够 直接 执行 的 语言 ， 不 
同 种 类 的 CPU 使 用 不 同 的 机 器 语言 。 

例如 ， 现 在 基本 上 所 有 的 个 人 计算 机 使 用 的 都 是 Intel 公司 的 486 这 款 CPU 的 后 续 产 品 ， 
486 有 着 自己 专用 的 机 器 语言 。Sun 公司 的 SPARC 系列 CPU 使 用 的 是 其 他 机 器 语言 。IBM A 
司 的 PowerPC 系列 CPU 使 用 的 又 是 不 一 样 的 机 器 语言 。486 的 机 器 语言 不 能 在 SPARC 上 运行 ， 
反 过 来 SPARC 的 机 絮语 言 也 不 能 在 486 上 运行 。 这 点 在 SPARC fll PowerPC, 486 fll PowerPC 
上 也 一 样 。 

GCC 将 C 语 言 的 程序 转化 为 用 机 器 语 言 (例如 486 的 机 需 语言 ) 描述 的 程序 。 将 机 器 语言 
的 程序 按照 ELF 这 种 特定 的 文件 格式 注入 文件 ， 得 到 的 就 是 可 执行 文件 。 


FI 编译 

那么 ace 命令 是 如 何 将 nello.c 转换 为 可 执行 文件 的 呢 ? 

由 hello.ec 这 样 的 单个 文件 来 生成 可 执行 文件 时 ， 虽 然 只 需要 执行 一 次 gcc 命令 ， 但 实 
际 上 其 内 部 经 历 了 如 下 4 个 阶段 的 处 理 。 
1. 预 处 理 

2. ( 狭义 的 ) 编译 

3. 汇编 

4. 链接 

上 述 处 理 也 可 以 统称 为 编译 ,但 严谨 地 说 第 2 阶段 进行 的 狭义 的 编译 才 是 真正 意义 上 的 编 
译 。 本 书 中 之 后 所 提 到 的 编译 ， 指 的 就 是 狭义 的 编译 。 这 4 个 阶段 的 处 理 我 们 统称 为 build。 

下 面 对 这 4 个 阶段 的 处 理 的 作用 进行 简单 的 说 明 。 
预 处 理 

C 语言 的 代码 首先 由 预 处理 器 (preprocessor ) X} &include 和 #define 进行 处 理 。 具 
体 来 说 ， 读 入 头 文 件 ， 将 所 有 的 宏 展开 ， 这 就 是 预 处理 (preprocess )。 预 处 理 的 英文 是 pre- 
process， 就 是 前 处 理 的 意思 。 这 里 的 “前 ”是 在 什么 之 前 呢 ? 当然 是 编译 之 前 了 。 

预 处 理 的 内 容 近 似 于 sed 命令 和 awk 命令 这 样 的 纯 文 本 操作 ， 不 考虑 C 语言 语法 的 含义 。 
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狭义 的 编译 

接着 ， 编 译 器 对 预 处 理 需 的 输出 进行 编译 ， 生 成 汇编 语言 (assemble language ) 的 代码 。 一 
般 来 说 ， 汇 编 语 言 的 代码 的 文件 扩展 名 是 “.s”。 

汇编 语言 是 由 机 器 语言 转换 过 来 的 人 类 较 易 阅读 的 文本 形式 的 语言 。 机 天语 言 是 以 CPU 的 
执行 效率 为 第 一 要 素 设计 的 ， 用 二 进 制 代码 表示 ， 每 一 个 bit 都 有 自己 的 含义 ， 人 类 很 难 理解 。 
因此 ， 一 般 要 使 用 与 机 器 语言 直接 对 应 的 汇编 语言 ， 以 方便 人 们 理解 。 
汇编 

然后 ， 汇 编 语 言 的 代码 由 汇编 器 (assembler) 转换 为 机 器 语言 ， 这 个 处 理 过 程 称 为 汇编 
( assemble )。 

ihi ae H9] HP BERAI (object file )。 一 般 来 说 ， 目 标 文件 的 扩展 名 是 “.o"”。 

Linux 中 ， 目 标 文 件 也 是 ELF 文件 。 既 然 都 是 ELF 文件 ， 那 么 究竟 是 目标 文件 还 是 可 执行 
文件 呢 ? 这 不 是 区 分 不 了 了 吗 ? 这 个 不 用 担心 。ELF 文件 中 有 用 于 提示 文件 种 类 的 标志 。 例 如 ， 
用 file 命令 来 查看 目标 文件 ， 会 像 下 面 这 样 显示 BLE. . .relocatable， 据 此 就 能 够 将 其 和 
可 执行 文件 区 分 开 。 






























































S file tlo 
t.o: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped 


链接 

目标 文件 本 身 还 不 能 直接 使 用 ， 无 论 是 直接 运行 还 是 作为 程序 库 (library ) 文件 调用 都 不 可 
以 。 将 目标 文件 转换 为 最 终 可 以 使 用 的 形式 的 处 理 称 为 链接 (link )。 使 用 程序 库 的 情况 下 ， 会 
在 这 个 阶段 处 理 程序 库 的 加 载 

例如 ， 假 设 Hello, World! 程序 经 过 编译 和 汇编 生成 了 目标 文件 hello.o， 链 接 hello.o 
即 可 生成 可 执行 文件 。 生 成 的 可 执行 文件 的 默认 文件 名 为 a . out ， 可 以 使 用 gcc 命令 的 -o 选 
项 来 修改 输出 的 文件 名 。 

顺便 提 一 下 ， 通 过 链接 处 理 生成 的 并 不 一 定 是 可 执行 文件 ， 也 可 以 是 程序 库 文件 。 程 序 库 
文件 相关 的 话题 将 在 第 19 章 中 详细 说 明 。 
build 过 程 总 结 

如 上 所 述 ，C 语言 的 代码 经 过 预 处 理 、 编 译 、 汇 编 、 链 接 这 4 个 阶段 的 处 理 ， 最 终生 成 可 
执行 文件 。 图 1.1 中 总 结 了 各 个 阶段 的 输出 文件 ， 我 们 再 来 确认 一 下 。 

本 书 将 对 这 4 个 处 理 阶 段 中 除 预 处 理 之 外 的 编译 、 汇 编 和 链接 进行 说 明 。 
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C 语言 代码 


Y sis 


预 处 理 后 的 代码 


p 


汇编 语言 的 代码 


ge 


目标 文件 


Y ss 


可 执行 文件 
1.1 生成 可 执行 文件 的 过 程 











/名 /程序 运行 环境 

build? 的 过 程 以 链接 为 终点 ,但 本 书 并 不 仅仅 局 限于 build 的 过 程 ， 还 会 涉及 build 之 后 的 程 
序 运行 环境 相关 的 话题 。 从 代码 的 编写 、 编 译 、 运 行 到 运行 结束 ， 理 解 上 述 全 部 过 程 是 我 们 的 
目标 。 换 言 之 ， 从 编写 完 程序 到 该 程序 被 运行 ， 所 有 环节 本 书 都 会 涉及 ( 图 1.2) 






























































运行 、 加 载 、 
build 链接 


代码 -—- JHE =p HE ”一 = 也 (结束 ) 


图 1.2 程序 运行 的 全 过 程 


为 何 除了 build 的 过 程 之 外 ， 本 书 还 要 涉及 程序 运行 的 环节 呢 ? 这 是 因为 在 现代 编程 语言 的 
运行 过 程 中 ， 运 行 环境 所 起 的 作用 越 来 越 大 。 

首先 ， 链接 的 话题 并 非 仅 仅 出 现在 build 的 过 程 中 。 如 果 使 用 了 共享 库 ， 那 么 在 开始 运行 程 
序 时 ， 链 接 才 会 发 生 。 最 近 广 泛 使 用 的 动态 加 载 (dynamic load )， 就 是 一 种 将 所 有 链接 处 理 放 
到 程序 运行 时 进行 的 手法 。 

其 次 , 像 Java 和 CH 这 种 语言 的 运行 环境 中 都 有 垃圾 回收 (Garbage Collection, GC ) 这 一 
强大 的 功能 ， 该 功能 对 程序 的 运行 有 着 很 大 的 影响 。 

再 次 , 在 Sun 的 Java VM 等 具有 代表 性 的 Java 的 运行 环境 中 ， 为 了 提高 运行 速度 ， 采 用 了 
JIT 编译 器 (Just In Time compiler )。JIT 编译 需 是 在 程序 运行 时 进行 处 理 ， 将 程序 转换 为 机 器 语 
言 的 编译 器 。 也 就 是 说 ，Java 语言 是 在 运行 时 进行 编译 的 。 



























































(D build 有 “构建 “生成 ”等 译 法 ,但 似乎 都 不 能 表达 出 其 全 意 ， 因 此 本 书 保留 了 英文 用 法 。 一 一 译 者 注 
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既然 涉及 了 这 样 的 话题 ， 仪 了 解 build 的 过 程 是 不 够 的 ， 还 必须 了 解 程序 的 运行 环境 。 不 掌 
握 包 含 运 行 环 境 在 内 的 整个 流程 ， 就 不 能 说 完全 理解 vise] 今后 ， 无 论 是 理解 程序 还 
是 制作 编译 器 ， 都 需要 了 解 从 build 到 运行 环境 的 整体 流程 。 
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o 
e. 编程 语言 的 运行 方式 





























编译 器 会 对 程序 进行 编译 ， 将 其 转换 为 可 执行 的 形式 。 另 外 也 有 不 进行 编译 ， 直 接 运 行 编程 语 
言 的 方法 。 解 释 器 (interpreter) 就 是 这 样 一 个 例子 。 解 释 器 不 将 程序 转换 为 别 的 语言 ， 而 是 直接 
运行 。 例 如 Ruby 和 Perl 的 语言 处 理 器 就 是 用 解释 器 来 实现 的 。 

运行 语言 的 手段 不 只 一 种 。 例 如 ，C 语言 也 可 以 用 解释 器 来 解释 执行 ，Ruby 也 可 以 编译 成 机 
器 语言 或 者 Java 的 二 进 制 码 。 也 就 是 说 ， 编 程 语言 与 其 运行 方式 可 以 自由 搭配 。 因 此 ， 编 译 器 也 
好 ， 解 释 器 也 罢 ， 都 是 处 理 并 运行 编程 语言 的 手段 之 一 ， 统 称 为 编程 语言 处 理 器 programming 
language processor ); 
但 是 ， 根 据 语 言 的 特点 ， 甚 运行 方式 有 适合 、 不 适合 该 语言 之 说 。 一 般 来 说 ， 有 静态 类 型 检查 
(static type checking )、 要 求 较 高 可 靠 性 的 情况 下 使 用 编译 的 方式 ; 相反 ， 没 有 静态 类 型 检查 、 对 
灵活 性 的 要 求 高 于 严密 性 的 情况 下 ， 则 使 用 解释 的 方式 。 
静态 类 型 检查 是 指 在 程序 开始 运行 之 前 ， 对 函数 的 返回 值 以 及 参数 的 类 型 进行 检查 的 功能 。 与 
之 相对 ， 在 程序 运行 过 程 中 随时 进行 类 型 检查 的 方式 称 为 动态 类 型 检查 ( dynamic type checking )。 

这 里 提 到 的 “动态 " “静态” 在 语言 处 理 器 的 话题 中 经 常 出 现 ， 所 以 最 好 记 住 。 说 到 “静态 ”， 
就 是 指 不 运行 程序 而 进行 某 些 处 理 ; 说 到 “动态 " ， 就 是 指 一 边 运 行程 序 一 边 进行 某 些 处 理 。 
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这 一 方 将 对 狭义 的 编译 的 内 部 处 理 过 程 进 行 介绍 。 


[F3 编译 的 4 个 阶段 
奖 义 的 编译 大 致 可 分 为 下 面 4 个 阶段 。 


1. 语法 分 析 
2. 语义 分 析 
3. 生成 中 间 代 码 
4. 代码 生成 


下 面 就 依次 对 这 4 个 阶段 进行 说 明 。 


语法 分 析 


一 般 我 们 所 说 的 编写 程序 ， 就 是 把 代码 写成 人 类 可 读 的 文本 文件 的 形式 。 像 C 和 Java 这 
样 ， 以 文本 形式 编写 的 代码 对 人 类 来 说 的 确 易于 阅读 ， 但 并 不 是 易于 计算 机 理解 的 形式 。 因 此 ， 
为 了 运行 C 和 Java 的 程序 ， 首 先 要 对 代码 进行 解析 ， 将 其 转换 为 计算 机 易于 理解 的 形式 。 这 里 
的 解析 (parse ) 也 称 为 语法 分 析 (syntax analyzing )。 解 析 代码 的 程序 模块 称 为 解析 器 (parser ) 
或 语法 分 析 器 ( syntax analyzer )。 

那么 “易于 计算 机 理解 的 形式 ”究竟 是 怎样 的 形式 呢 ? 那 就 是 称 为 语法 树 (syntax tree ) 的 
形式 。 顾 名 思 义 ， 语 法 树 是 树 状 的 构造 。 将 代码 转化 为 语法 树 形式 的 过 程 如 图 1.3 所 示 。 

代码 语法 树 


EE AN 
28 


人 X + 
z 






























































X=y+2; 


人 人、 
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语义 分 析 
通过 解析 代码 获得 语法 树 后 ， 接 着 就 要 解析 语法 树 ， 除 去 多 余 的 内 容 ， 添 加 必要 的 信息 ， 
生成 抽象 语法 树 (Abstract Syntax Tree, AST) 这 样 一 种 数据 结构 。 上 述 处 理 就 是 语义 分 析 
( semantic analysis )。 
语法 分 析 只 是 对 代码 的 表象 进行 分 析 ， 语 义 分 析 则 是 对 表象 之 外 的 部 分 进行 分 析 。 举 例 来 
说 ， 语 义 分 析 包 括 以 下 这 些 处 理 。 



























































e 区 分 变量 为 局 部 变量 还 是 全 局 变量 
e 解析 变量 的 声明 和 引用 
e 变量 和 表达 式 的 类 型 检查 
e 检查 在 引用 变量 之 前 是 否 进行 了 初始 化 
e 检查 函数 是 否 按照 定义 返回 了 结果 

上 述 处 理 的 结果 都 会 反映 到 抽象 语法 树 中 。 语 法 分 析 生成 的 语法 树 只 是 将 代码 的 构造 照搬 
了 过 来 ， 而 语义 分 析 生 成 的 抽象 语法 树 中 还 包含 了 语义 信息 。 例 如 ， 在 变量 的 引用 和 定义 之 间 
添加 链接 ， 适 当地 增加 类 型 转换 等 命令 ， 使 表达 式 的 类 型 一 致 。 另 外 ， 语 法 树 中 的 表达 式 外 侧 
的 括号 、 行 末 的 分 号 等 ， 在 抽象 语法 树 中 都 被 省 略 了 。 


f 生成 中 间 代 码 
生成 抽象 语法 树 后 ， 接 着 将 抽象 语法 树 转化 为 只 在 编译 器 内 部 使 用 的 中 间 代码 


( Intermediate Representation, IR )。 

之 所 以 特地 转化 为 中 间 代 码 ， 主 要 是 为 了 支持 多 种 编程 语言 或 者 机 器 语言 。 

例如 ，GCC 不 仅 支 持 C 语言 ， 还 可 以 用 来 编译 C++ 和 Fortran; CPU 方面 ， 不 仅 是 Intel 的 
CPU， 还 可 以 生成 面向 Alpha、SPARC、MIPS 等 各 类 CPU 的 机 器 语言 。 如 果 要 为 这 些 语言 和 
CPU 的 各 种 组 合 单独 制作 编译 器 ， 将 耗费 大 量 的 时 间 和 精力 。Intel CPU 用 的 C 编译 器 、Intel 
CPU 用 的 C++ air, Intel CPU 用 的 Fortran 编译 器 、Alpha 用 的 C 编译 器 …… 要 制作 的 编译 
器 的 数量 将 非常 庞大 (图 1.4)。 
























































































































































C Intel Core 
C++ SPARC 
Fortran MIPS 
Java ARM 





图 1.4 不 使 用 中 间 代 码 的 情况 
而 如 果 将 所 有 的 编程 语言 先 转 化 为 共同 的 中 间 代 码 ， 那 么 对 应 一 种 语言 或 一 种 CPU， 只 要 
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添加 一 份 处 理 就 够 了 (图 1.5 )。 因 此 支持 多 种 语言 C Intel Core 

或 CPU 的 编译 器 使 用 中 间 代 码 是 比较 合适 的 。 例 ”C++ g 中 间 代码 à SPARC 

如 GCC 使 用 的 是 一 种 名 为 RTL (Register Transfer Fortran COMM MIPS 

Languange ) 的 中 间 代 码 。 Java ARM 
根据 编译 需 的 不 同 ， 也 存在 不 经 过 中 间 人 代码， 图 1.5 使 用 中 间 代 码 的 情况 














直接 从 抽象 语法 树 生成 机 噩 语言 的 情况 。 本 书 制作 的 Cb 编译 需 最 初 并 没有 使 用 中 间 代 码 ， 后 来 
发 现 使 用 中 间 代 码 的 话 ， 代 码 的 可 读 性 和 简洁 性 都 要 更 胜 一 筹 ， 所 以 才 决 定 使 用 中 间 代 码 。 
解析 代码 转化 为 中 间 代 码 为 止 的 这 部 分 内 容 ， 称 为 编译 名 的 前 端 〈 front-end )。 


F3 代码 生成 

最 后 把 中 间 代 码 转 换 为 汇编 语言 ， 这 个 阶段 称 为 代码 生成 (code generation )。 负 责 代 码 生 
成 的 程序 模块 称 为 代码 生成 器 (code generator )。 

代码 生成 的 关键 在 于 如 何 来 填补 编程 语言 和 汇编 语言 之 间 的 差异 。 一 般 而 言 ， 比 起 编程 语 
言 ， 汇 编 语 言 在 使 用 上 面 的 限制 要 多 一 些 。 例 如 ，C 和 Java 可 以 随心 所 欲 地 定义 局 部 变量 ， 而 


汇编 语言 中 能 够 分 配给 局 部 变量 的 寄存 带 只 有 不 到 30 个 而 已 。 处 理 流程 控制 方面 也 只 有 和 goto 
语句 功能 类 似 的 跳 转 指令 。 在 这 样 的 限制 下 ， 还 必须 以 不 改变 程序 的 原 有 语义 为 前 提 进 行 转换 。 


优化 

除了 之 前 讲述 的 4 个 阶段 之 外 ， 现 实 的 编译 器 还 包括 优化 (optimization ) 阶段 。 

现在 的 计算 机 ， 即 便 是 同样 的 代码 ， 根 据 编译 器 优化 性 能 的 不 同 ， 运 行 速度 也 会 有 数 倍 的 
差距 。 由 于 编译 器 要 人 处理 相 当 多 的 程序 ， 因 此 在 制作 编译 器 时 ， 最 重要 的 一 点 就 是 要 尽 可 能 地 
提高 编译 出 来 的 程序 的 性 能 。 

优化 可 以 在 编译 器 的 各 个 环节 进行 。 可 以 对 抽象 语法 树 进行 优化 ， 可 以 对 中 间 代 码 的 代码 
进行 优化 ， 也 可 以 对 转换 后 的 机 器 语言 进行 优化 。 进 一 步 来 说 ， 不 仅 是 编译 器 ， 对 链接 以 及 运 
行 时 调用 的 程序 库 的 代码 也 都 可 以 进行 优化 。 






















































































FJ ais 


经 过 上 述 4 个 阶段 ， 以 文本 形式 编写 的 代码 就 被 转换 为 了 汇编 语言 。 之 后 就 是 汇编 邦和 链 
接 需 的 工作 了 。 
本 书 中 所 制作 的 编译 絮 主 要 实现 上 述 4 个 阶段 的 处 理 。 
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使 用 Cb 编译 器 进行 编译 








本 节 我 们 来 了 解 一 下 Cb 编译 器 的 使 用 方法 。 


FJ cb 编译 器 的 必要 环境 
使 用 Cb 编译 器 所 需要 的 软件 有 如 下 3 项 。 


























1. Linux 

2. JRE ( Java Runtime Environment ) 1.5 以 上 版 本 

3. Java 编译 器 ( 非 必需 ) 

首先 ， 要 想 运 行 Cb 编译 器 build 的 程序 ， 需 要 运行 在 Intel CPU ( 包括 AMD 等 的 同 架构 
CPU) 上 的 Linux。 这 里 对 Linux 的 发 行 版 本 没有 特别 的 要 求 ， 大 家 可 以 选择 喜欢 的 Linux 发 行 
版 本 来 安装 。 本 书 不 对 Linux 的 安装 方法 进行 说 明 。 

另外 ， 虽 然 这 里 以 在 32 位 版 本 的 Linux 上 运行 为 前 提 ， 但 通过 使 用 兼容 模式 ，64 位 的 
Linux 也 可 以 运行 32 位 的 程序 2。 

运行 Cb 编译 右 需 要 JRE (Java 运行 时 环境 )。 本 书 不 对 JRE 的 安装 进行 说 明 ， 请 根据 所 使 
用 的 Linux 发 行 版 本 的 软件 安装 方法 进行 安装 。 

最 后 ， 本 书 制作 的 Cb 编译 器 是 用 Java 实现 的 。 因 此 build Cb 编译 吉本 身 需 要 Java 的 编译 
器 。 如 果 只 是 使 用 Cb 编译 器 的 话 ， 则 不 需要 Java 编译 髓 。 


[子安 装 Cb 编 译 器 
接着 说 一 下 Cb 编译 器 的 安装 方法 ， 在 此 之 前 请 先 安装 好 Linux 和 Java 运行 环境 。 
首先 下 载 Cb 编译 器 的 jar 文件 。。 
下 载 的 文件 是 用 car M gzip 打包 压缩 的 ， 请 使 用 如 下 命令 进行 解压 。 





























































































































$ tar xzf cbc-1.0.tar.gz 





(D XT Linux 的 兼容 模式 ， 请 参考 http://www.ituring.com.cn/book/1308, 2» 4b, 35,91 4-3 ubuntu 64 位 
系统 下 的 cbe MA : https://github.com/leungwensen/cbc-ubuntu-64bit ( 提供 docker 镜像 )。 一 一 译 者 注 
© 打开 http:/www.ituring.com.cn/book/1308， 点 击 “ 随 书 下 载 ”， 下 载 Cb 编译 器 。 
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解压 后 会 生成 名 为 cpc-1.0 的 目录 ,进入 该 目录 。 接 着 ， 如 下 切换 到 超级 用 户 〈root )， 
运行 install .sh， 这 样 安装 就 完成 了 。 所 有 的 文件 都 会 被 安装 到 /usr/Local 的 目录 下 。 


$ cd cbc-1.0 
$ su 
# ./install.sh 


没有 root 权限 的 用 户 ， 也 可 以 安装 到 自己 的 home 目录 下 面 。 如 下 运行 install.sh, WÈ 
可 以 把 文件 安装 到 $HOME/cbc 目录 下 面 。 


$ prefix=$HOME/cbc ./install.sh 


Cb 的 Hello, World! 


安装 完 Cb 的 编译 器 后 ， 让 我 们 来 试 着 build 一 下 Cb 的 Hello,World! FE JF IE. Cb 的 
Hello,World! 程序 如 代码 清单 1.2 所 示 。 
代码 清单 1.2 ”Cb 的 Hello,World! ( hello.cb ) 





import stdio; 
int 


main(int argc, char **argv) 


( 


printf("Hello, World! Win"); 
return 0; 


build 文件 时 ， 先 进入 hello.cb 所 在 的 目录 ， 然 后 在 shell 中 输入 如 下 命令 即 可 。 
$ cbc hello.cb 


和 gcc 不 同 的 是 ，cpc 不 需要 输入 任何 选项 ， 和 输出 的 文件 名 就 为 hello。 因 此 ， 只 要 cbe 
命令 正常 结束 ， 应 该 就 能 生成 可 执行 文件 hello。 确认 hello 已 经 生成 后 ， 如 下 运行 该 文件 。 





$ ./hello 
Hello, World! 








如 果 像 这 样 显示 了 Hello,World!, NEUE] cbe 编译 器 运行 正常 。 并 且 上 述 hello 命令 
是 纯粹 的 Linux 原生 应 用 程序 ， 在 没有 安装 cbe 的 Linux Hlé E489] LAE d$ 3517 o 
下 一 章 将 对 Cb 语言 和 cbc 进行 说 明 。 
































Cb 和 cbc 


本 章 将 对 本 书 制作 的 编译 器 及 其 实现 的 概要 进行 
说 明 。 
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本 书 制作 的 编译 絮 可 将 Cb 这 种 语言 编译 为 机 絮语 言 。 本 节 首 和 完 对 Cb 语言 的 概要 进行 简单 
的 说 明 。 
































Cb 的 Hello, World ! 


Cb 是 C 语言 的 简化 版 ， 省 略 了 C 语言 中 琐碎 的 部 分 以 及 难以 实现 、 容 易 混 消 的 功能 ， 实 现 
起 来 条 理 更 加 清晰 。 虽 然 如 此 ，Cb 仍 保留 了 包括 指针 等 在 内 的 C 语言 的 重要 部 分 。 因 此 ， 理 解 
了 Cb 的 编译 过 程 ， 也 就 相当 于 理解 了 C 程序 的 编译 过 程 。 

让 我 们 再 来 看 一 下 用 Cb 语言 编写 的 Hello,World! 程序 ， 如 代码 清单 2.1 所 示 。 
代码 清单 2.1 用 Cb 语言 编写 的 Hello,World! 程序 


import stdio; 




















int 

main(int argc, char **argv) 
printf("Hello, World!Wn"); 
return 0; 




















可 见 该 程序 和 C 语言 几乎 没有 差别 ， 不 同 之 处 只 是 用 import 替代 了 #incluade， 仅 此 而 已 。 

本 书 的 目的 是 让 读者 理解 “在 现 有 的 OS 上 ， 现 有 的 程序 是 如 何 编译 及 运行 的 ”。 那 些 有 着 
诸多 不 切实 际 的 限制 ， 仅 能 作为 书 中 示例 的 “玩具 ”语言 ， 对 其 进行 编译 丝毫 没有 意义 。 从 这 
个 角度 来 说 ，C 语言 作为 编程 语言 是 非常 具有 现实 意义 的 ， 而 Cb 则 十 分 接近 于 C 语言 。 因 此 ， 
理解 了 Cb， 对 于 现实 的 程序 就 会 有 更 深刻 的 认识 。 


Cb 中 删 减 的 功能 


为 了 使 编译 需 的 处 理 简 明 扼要 ， 下 面 这 些 C 语言 的 功能 不 会 出 现在 Cb 中 。 


@ 预 处 理 器 
e K&R 语法 


e XR 
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9 enum 

e 结构 体 ( struct ) 的 位 域 ( bit field 
e 结构 体 和 联合 体 ( union ) 的 赋 1 
e 结构 体 和 联合 体 的 返回 
e ZSRR 


9 const 



































Emus 














9 volatile 

9 auto 

9 register 

简单 地 说 一 下 删除 上 述 功能 的 原因 。 

HIE, Cb 同 C 语言 最 大 的 差异 在 于 Cb 没有 预 处 理 咒 。 认 真 地 制作 C 语言 的 预 处 理 需 会 花 
费 过 多 的 时 间 和 精力 ， 进 而 无 法 专注 于 本 书 的 主题 一 一 编译 需 。 

但 是 ， 因 为 省 略 了 预 处 理 器 ， 所 以 Cb 无 法 使 用 #dqefine 和 #incluae。 特 别 是 不 能 使 用 
#include， 将 无 法 导入 类 型 定义 和 函数 原型 ,这 是 有 问题 的 。 为 了 解决 该 问题 ，Cb 使 用 了 与 
Java 类 似 的 import 关键 字 。import 关键 字 的 用 法 将 稍 后 说 明 。 

数据 类 型 方面 也 做 了 一 些 变化 。 

首先 ， 删 除了 和 序 点 数 相关 的 所 有 功能 。 浮 点 数 的 计算 是 比较 重要 的 功能 ， 笔 者 也 想 对 此 
进行 实现 ， 但 由 于 本 书页 数 的 限制 ， 最 后 也 只 能 放弃 。 

其 次 ,由 于 C 语言 的 enum 和 生成 名 称 连 续 的 int 型 变量 的 功能 本 质 上 无 太 大 区 别 ， 因 此 
为 了 降低 编译 器 实现 的 复杂 度 ， 这 里 将 其 删除 。 至 于 结构 体 和 联合 体 ， 主 要 也 是 考虑 到 编译 器 
的 复杂 度 ， 才 删除 了 类 似 的 使 用 频率 不 高 或 非 核心 的 功能 。 

volatile 和 const 还 是 比较 常用 的 ， 但 因为 cbe 几乎 不 进行 优化 ， 所 以 volatile 本 
身 并 没有 太 大 意义 。const 可 以 有 条 件 地 用 数字 字面 量 和 字符 串 字 面 量 来 实现 。 

最 后 ，auto ZW register 不 仅 使 用 频率 低 ， 而 且 并 非 必要 ， 所 以 将 其 也 删除 了 。 


import 关键 字 


下 面 对 Cb 中 新 增 的 import 关键 字 进 行 说 明 。 
Cb 在 语法 上 和 C 语言 稍 有 差异 ， 而 且 没 有 预 处 理 器 ， 所 以 不 能 直接 使 用 C 话 言 的 头 文件 。 
为 了 能 够 从 外 部 程序 库 导 入 定义 ，Cb 提供 了 import 关键 字 。import 的 语法 如 下 所 示 。 


























































































































import 导入 文件 ID; 


下 面 是 具体 的 示例 。 




















import stdio; 
import sys.params; 
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导入 文件 类 似 于 C 语言 中 的 头 文件 ， 记 载 了 其 他 程序 库 中 的 函数 、 变 量 以 及 类 型 的 定义 。 
cbe 中 有 stdio.hb, stdlib.hb, sys/params.hb 等 导入 文件 ， 当 然 也 可 以 自己 编写 导入 
文件 。 

导入 文件 的 ID 是 去 掉 文 件 名 后 的 “.hb”， 并 用 “. ”取代 路 径 标 识 中 的 人 ”后 得 到 的 。 
例如 导入 文件 stdio.hb 的 ID 为 stdaio， 导 入 文件 sys/params . hb 的 ID 为 sys.params。 


导入 文件 的 规范 


下 面 让 我 们 看 一 个 导入 文件 的 例子 ，cbc 中 的 stdaio .hb 的 内 容 如 代码 清单 2.2 所 示 。 
代码 清单 2.2 ”导入 文件 stdio.hb 


// stdio.hb 





import stddef;  // for NULL and size t 
import stdarg; 


typedef unsigned long FILE; // dummy 


extern FILE* stdin; 
extern FILE* stdout; 
extern FILE* stderr; 


extern FILE* fopen(char* path, char* mode); 

extern FILE* fdopen(int fd, char* mode); 

extern FILE* freopen(char* path, char* mode, FILE* stream); 
extern int fclose(FILE* stream); 
















































































只 有 下 面 这 些 声明 能 够 记述 在 导入 文件 中 。 
e 函数 声明 

e 变量 声明 ( 不 可 包含 初始 值 的 定义 ) 

e 常量 定义 ( 这 里 必须 有 初始 值 

e 结构 体 定 义 

e 联合 体 定 义 

@ typedef 


函数 及 变量 的 声明 必须 添加 关键 字 extern。 并 且 在 Cb 中 ,函数 返回 值 的 类 型 、 参 数 的 类 
型 、 参 数 名 均 不 能 省 略 。 
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Cb 编译 器 cbc 的 构成 











阅读 有 一 定数 量 的 代码 时 ， 首 先 要 做 的 就 是 把 握 代 码 目录 以 及 文件 的 构成 。 这 一 节 将 对 本 
书 制 作 的 Cb 编译 器 cbe 的 代码 构成 进行 说 明 。 


cbc 的 代码 树 


cbe 采用 Java 标准 的 目录 结构 ， 即 将 作者 的 域名 倒序 ， 将 倒序 后 的 域名 作为 包 C package ) 
名 的 前 级 ， 按 层次 排列 。 比 如 ， 笔 者 的 个 人 主页 的 域名 是 loveruby.net， 则 包 名 以 net. 
loveruby 开头 ， 接 着 是 程序 的 名 称 cf1at， 其 下 面 排列 着 cbe 所 用 的 包 。 代 码 的 目录 结构 如 
图 2.1 所 示 。 


























net 


C 


=| 





图 2.1 cbc 中 包 的 层次 


从 asm 到 utils 的 11 个 目录 ， 各自 对 应 着 同名 的 包 。 也 就 是 说 ,cbc 有 11 个 包 ， 所 
有 cbe 的 类 都 属于 这 11 个 包 中 的 某 一 个 。cbc 不 直接 在 net . 1overuby 和 net . loveruby. 
cflat 下 面 放置 类 。 
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cbc 的 包 





cbe 的 包 的 内 容 如 表 2.1 所 示 〈 省 略 了 包 名 的 前 缀 net.loveruby.cflat). 







































































表 2.1 cbc 中 的 包 

包 包 中 的 类 

asm 汇编 对 象 的 类 

ast 抽象 语法 树 的 类 

compiler Compiler 类 等 编译 器 的 核心 类 

entity 表示 函数 和 变量 等 实体 的 类 

exception 异常 的 类 

ir 中 间 代 码 的 类 

parser 解析 器 类 

sysdep 包含 依赖 于 OS 的 代码 的 类 ( 汇编 器 和 链接 器 ) 
sysdep.x86 包含 依赖 于 OS 和 CPU 的 代码 的 类 ( 代码 生成 器 ) 
type 表示 Cb 的 类 型 的 类 

utils 小 的 工具 类 























在 这 些 包 之 中 ,asm、ast、entity、ir、type 这 5 个 包 可 以 归结 为 数据 相关 (被 操作 ) 
的 类 。 男 一 方面 ，compiler、parser、sysdep、sysdep.x86 这 4 个 包 可 以 归结 为 处 理 相 
关 ( 进行 操作 的 一 方 ) 的 类 。 

把 握 代码 整体 结构 时 最 重要 的 包 是 compiler 包 ， 其 中 基本 收录 了 cbe 编译 器 前 端的 所 有 
内 容 。 人 例如， 编译 器 程序 的 人 口 函 数 main 就 定义 在 compiler 包 的 Compiler 类 中 。 


compiler 包 中 的 类 和 群 


我 们 先 来 看 一 下 compiler 包 中 的 类 。compiler 包 中 主要 的 类 如 表 2.2 所 示 。 
表 2.2 compiler 包 中 主要 的 类 


































































































类 名 作用 

Compiler 统管 其 他 所 有 类 的 facade 类 ( compiler driver ) 
Visitor 

DereferenceChecker 

LocalReferenceResolver 语义 分 析 相 关 的 类 (第 9 章 ) 

TypeChecker 

TypeResolver 

IRGenerator 从 抽象 语法 树 生成 中 间 代 码 的 类 ( 58 11 xx ) 

















Compiler 类 是 统管 cbe 的 整体 处 理 的 类 。 编 译 器 的 入口 函数 main 也 在 Compiler %4 
定义 。 

从 Visitor 类 到 TypeResolver 类 都 是 语义 分 析 相 关 的 类 。 关 于 这 些 类 的 作用 将 在 第 9 
章 详 细 说 明 。 


D 
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最 后 ，IRGenerator 是 将 抽象 语法 树 转 化 为 中 间 代 码 的 类 ， 详 情 请 参考 第 11 章 。 


main 函数 的 实现 


在 本 章 最 后 ， 我 们 一 起 来 大 概 地 看 一 下 Compiler 类 的 代码 。compiler 类 中 main Æ 
的 代码 如 代码 清单 2.3 所 示 。 
代码 清单 2.3 Compiler#main ( compiler/Compiler.java ) 





static final public String ProgramName = "cbc"; 
Static final public String Version - "1.0.0"; 


Static public void main(String[] args) ( 
new Compiler (ProgramName) .commandMain (args); 


private final ErrorHandler errorHandler; 


public Compiler (String programName) { 
this.errorHandler = new ErrorHandler (programName) ; 


} 
main KUH, 3b new Compiler (ProgramName) 生成 Compiler 对 象 ， 将 命令 行 参 
数 args 传递 给 commandMain 函数 并 执行 。ProgramName 是 字符 串 常量 "cbe" o 
Compiler 类 的 构造 函数 中 ， 新 建 ErrorHandler 对 象 并 将 其 设 为 Compiler 的 成 员 。 
之 后 ， 在 输出 错误 或 警告 消息 时 使 用 该 对 象 。 








commandMain 函数 的 实现 


接着 来 看 一 下 负责 cbe 主要 处 理 的 commandMain 函数 (代码 清单 2.4 )。 原 本 的 代码 中 包 
含 较 多 异常 处 理 的 内 容 ， 比 较 繁 琐 ， 因 此 这 里 只 列举 主要 部 分 。 
代码 清单 2.4 Compiler#commandMain 的 主要 部 分 ( compiler/Compiler.java ) 





public void commandMain(String[] args) { 
Options opts - Options.parse (args); 
List«SourceFile» srcs - opts.sourceFiles(); 
build(srcs, opts); 


) 


commandMain PiZ T, fH options 类 的 parse KAKMA args, FH 
f$ SourceFile 对 象 的 列表 (list), 一 个 SourceFile 对 象 对 应 一 份 源 代码 。 实 际 的 build 部 
分 ， 是 由 buila 函数 来 完成 的 。 

Options 对 象 中 的 成 员 如 表 2.3 所 示 。 
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表 2.3 Options 对 象 的 成 员 



































类 型 成 员 作用 

CompilerMode mode 提示 build 处 理 在 何 处 停止 

String outpuFileName 输出 的 文件 名 

LibraryLoader loader EHE import 文件 的 对 象 

boolean debugParser 若 为 true， 则 输出 解析 器 的 debug log 
boolean verbose 若 为 true， 则 表示 详细 模式 ( verbose mode 
































Options 对 象 中 还 定义 有 其 他 成 员 和 函数 ， 因 为 只 和 代码 生成 品 、 汇 编 需 
所 以 等 介绍 上 述 模块 时 再 进行 说 明 。 


Java5 泛 型 











、 链 接 需 相关 ， 





可 能 有 些 读者 对 List<SourceFile> 这 样 的 表达 式 还 比较 陌生 ， 所 以 这 里 解释 一 下 。 

















List<SourceFile> 表示 “成 员 的 类 型 为 sourceFile 的 列表 ”， 简 单 地 说 就 是 





"SourceFile 对 象 的 列表 ”。 到 J2SE 1.4 为 止 ， 还 不 可 以 指定 List, Set 等 集合 中 元 素 对 象 














的 类 型 。 从 Java 5 开始 ， 才 可 以 通过 集合 类 名 < 成 员 类 名 > 来 指定 元 素 成 员 的 类 























转换 了 。 














型 


=E o 


通过 采用 这 种 写法 ，Java 编译 央 就 知道 元 素 的 类 型 ， 在 取出 元 素 对 象 时 就 不 需要 进行 类 型 











这 种 能 够 对 任意 类 型 进行 共通 处 理 的 功能 称 为 泛 型 。 在 Javas 新 增 的 功能 中 ， 泛 型 使 用 起 











来 尤其 方便 ， 是 不 可 缺少 的 一 项 功能 。 


build 函数 的 实现 








我 们 继续 看 负责 build 代码 的 buila 函数 ， 其 代码 大 概 如 代码 清单 2.5 所 示 。 
代码 清单 2.5 Compiler#build 的 主要 部 分 ( compiler/Compiler.java ) 


public void build(List«SourceFile» srcs, Options opts) 
throws CompileException [ 


for (SourceFile src : srcs) { 
compile(src.path(), opts.asmFileNameOf (src), opts); 
assemble(src.path(), opts.objFileNameOf (src), opts); 
) 
link(opts); 


) 


首先 ,用 foreach 语句 〈 稍 候 讲 解 ) 将 Sourcerile 对 象 逐个 取出 ， 并 交 由 compile 函数 





进行 编译 。compile 函数 是 对 单个 Cb 文件 进行 编译 ， 并 生成 汇编 文件 的 函数 。 
接着 ， 调 用 assemble 函数 来 运行 汇编 需 ， 将 汇编 文件 转换 为 目标 文件 。 
最 后 ， 使 用 link 函数 将 所 有 的 对 象 文件 和 程序 库 链 接 。 
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可 见 上 述 代 码 和 第 1 章 中 叙述 的 build 的 过 程 是 完全 对 应 的 。 


Java 5 fff foreach 语句 


AEN 一 下 Java 5 中 新 增 的 foreach i$ RJ, foreach 语句 ， 在 写 代 码 时 也 可 以 写成 
“GE pm t£ IIl E foreach 话 句 。 
foreach 语句 是 反复 使 用 Iterator 对 象 的 语句 的 省 略 形式 。 例 如 , Æ build 函数 中 有 如 
下 foreach 语句 。 








for (SourceFile src : srcs) ( 
compile(src.path(), opts.asmFileNameOf (src), opts); 
assemble(src.path(), opts.objFileNameOf (src), opts); 


} 
这 个 foreach 语句 等 同 于 下 面 的 代码 。 


Iterator<SourceFile> it = srcs.iterator(); 

while (it.hasNext()) { 
SourceFile src - it.next(); 
compile(src.path(), opts.asmFileNameOf (src), opts); 
assemble(src.path(), opts.objFileNameOf (src), opts); 


) 


通过 使 用 foreach 语句 ， 遍 历 列表 等 容器 的 代码 会 变 得 非常 简洁 ， 因 此 本 书 中 将 尽量 使 用 
foreach 语句 。 


^J compile 函数 的 实现 


最 后 我 们 来 看 一 下 负责 编译 的 compiler 函数 的 代码 。 剩 余 的 assemble 函数 和 link P 
数 将 在 本 书 的 第 4 部 分 进行 说 明 。 

compiler 函数 中 也 有 用 于 在 各 阶段 处 理 结束 后 停止 处 理 的 代码 等 ， 多 余 的 部 分 比较 多 ， 
所 以 这 里 将 处 理 的 主要 部 分 提取 出 来 ， 如 代码 清单 2.6 所 示 。 
代码 清单 2.6 Compiler#compiler 的 主要 部 分 ( compiler/Compiler.java ) 














public void compile(String srcPath, String destPath, 
Options opts) throws CompileException { 

AST ast - parseFile(srcPath, opts); 
TypeTable types - opts.typeTable(); 
AST sem - semanticAnalyze(ast, types, opts); 
IR ir - new IRGenerator(errorHandler).generate(sem, types); 
String asm - generateAssembly(ir, opts); 
writeFile(destPath, asm); 





) 
首先 ， 调 用 parseFile 函数 对 代码 进行 解析 ， 得 到 的 返回 值 为 AST 对 象 ( 抽象 语法 树 )。 
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再 调用 semanticAanalyze KO AST 对 象 进行 语义 分 析 ， 完 成 抽象 语法 树 的 生成 。 接 着 ， 
调用 IRGenerator 类 的 generate 函数 生成 IR 对 象 (PERI )。 至 此 就 是 编译 絮 前 端 处 理 
的 代码 。 

之 后 ， 调 用 generateAssembly 水 数 生成 汇编 语言 的 代码 ， 并 通过 writteFile KAS 
入 文件 。 这 样 汇编 代码 的 文件 就 生成 了 。 

从 下 一 章 开 始 ， 我 们 将 进入 语法 分 析 的 环节 。 























代码 分 析 








第 3 章 语法 分 析 的 概要 
第 4 章 词法 分 析 
第 5 章 基于 JavaCC 的 解析 器 的 描述 





第 6 章 


语法 分 析 








语法 分 析 的 概要 


本 章 先 简单 地 介绍 一 下 负责 代码 分 析 的 语法 分 析 
器 的 相关 内 容 ， 接 着 对 描述 cbe 的 解析 器 所 使 用 
的 JavaCC 这 一 工具 的 概要 进行 说 明 。 
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语法 分 析 的 方法 








本 节 将 对 语法 分 析 的 一 般 方法 进行 说 明 。 


代码 分 析 中 的 问题 点 


代码 的 分 析 可 不 是 用 普通 的 方法 就 可 以 解决 的 。 例 如 ， 考 虑 一 下 C 语言 中 的 算式 。C 语言 
中 的 8+2-3 应 该 解释 为 (8+2) -3, 但 8+2*3 的 话 就 应 该 解释 为 8+ (2*3)。 分 析 算 式 时 ， 一 
定 要 考虑 运算 符 的 优先 级 ( operator precedence )。 

C 语言 中 能 够 填写 数字 的 地 方 可 以 用 变量 或 数组 、 结 构 体 的 元 素来 蔡 代 ， 甚 至 还 可 以 是 函 
数 调 用 。 对 于 这 种 多 样 性 ， 编 译 器 都 必须 能 够 处 理 。 

而 且 ， 无 论 是 算式 、 变 量 还 是 函数 调用 ， 如 果 出 现在 注释 中 ， 则 不 需要 处 理 。 同 样 ， 出 现 
在 字符 串 中 也 不 需要 处 理 。 编 译 需 必须 考虑 到 这 种 因 上 下 文 而 产生 的 差异 。 

如 上 所 述 ， 在 分 析 编 程 语言 的 代码 时 ， 需 要 考虑 到 各 种 因素 ， 的 确 非 常 棘手 。 


代码 分 析 的 一 般 规 律 


为 了 处 理 分 析 代 码 时 产生 的 各 类 问题 ， 人 们 尝试 了 各 种 手段 ， 现 在 编程 语言 的 代码 分 析 在 
多 数 范围 内 都 有 一 般 规 律 可 循 。 只 要 遵循 一 般 规 律 ， 绝 大 多 数 的 编程 语言 都 能 够 顺利 分 析 。 

另外 ， 如 果 将 编程 语言 设计 得 能 够 根据 一 般 规 律 进行 代码 分 析 ， 那 么 之 后 的 处 理 就 会 容易 
得 多 。Cb 就 是 这 样 设计 的 一 种 语言 。 它 将 C 语言 中 不 符合 代码 分 析 一 般 规 律 的 部 分 进行 了 改 
良 ， 尽 量 简化 了 代码 分 析 处 理 。 

换言之 ，Cb 语言 中 所 修改 的 规范 也 就 是 利用 一 般 规律 难以 处 理 的 规范 。 关 于 这 部 分 规范 的 
内 容 ， 以 及 原来 的 规范 为 什么 使 用 一 般 规律 难以 处 理 ， 后 文 将 进行 适当 的 说 明 。 


[Fi 词法 分 析 、 语 法 分 析 、 语 义 分 析 


接着 ， 我 们 就 来 具体 了 解 一 下 代码 分 析 的 一 般 规 律 。 第 1 章 中 提 到 了 代码 分 析 可 分 为 语法 
分 析 和 语义 分 析 两 部 分 。 一 般 来 说 ， 语 法 分 析 还 可 以 继续 细 分 为 以 下 2 个 阶段 。 
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第 3 章 





1. 词法 分 析 
2. 语法 分 析 














语法 分 析 的 概 


首先 解释 一 下 词法 分 析 。 
词法 分 析 (lexical analyze ) 就 是 将 代码 分 制 为 一 个 个 的 单词 ， 也 可 以 称 为 扫描 ( scan )。 举 





例 来 说 ， 词 法 分 析 就 是 将 x=1+2 这 样 的 程序 分 割 为 “x”“=”“ 











» €€ » 
工 十 


“2” 这 样 5 个 单词 。 


并 且 在 该 过 程 中 ,会 将 空白 符 和 注释 这 种 对 程序 没有 实际 意义 的 部 分 剔除 。 正 因为 预先 有 了 词 








法 分 析 ， 语 法 分 析 融 才 可 以 只 处 到 





有 意义 的 单词 ， 进 而 实现 简化 处 理 。 





负责 词法 分 析 的 模块 称 为 词法 分 析 器 (lexical analyzer )， 又 称 扫描 器 (scanner )。 
理想 的 情况 是 将 词法 分 析 、 语 法 分 析 、 语 义 分 析 这 3 个 阶段 做 成 3 个 独立 的 模块 ， 这 样 的 





代码 是 最 优美 的 。 但 实际 上 ， 这 3 个 阶段 并 不 能 明确 地 分 割 开 。 现 有 的 编程 语言 
分 析 、 语 法 分 析 、 语 义 分 析 清 晰 地 分 割 开 的 怒 怕 也 不 多 。 因 此 ， 比 较 实 际 的 做 法 是 以 结构 简 》 


为 目标 ， 在 意识 到 存在 3 个 阶段 的 基础 上 ， 进 行 各 类 尝试 和 修改 。 


本 书 中 制作 的 Cb 2j 


模块 中 来 实现 。 


ac^ 


4 












































这 里 点 需要 涪 
分 才 称 为 “语法 分 析 ”; 
两 者 合 起 来 称 为 “语法 分 析 ”。 








X: 





H 





FE 意 ， 实 际 上 “语法 分 析 ” 有 两 重 含 















































“语法 分 析 ” 一 词 的 二 义 性 








C EAT MED SE 





分 析 以 外 的 部 


其 二 ， 正 如 在 第 1 章 中 提 到 的 狭义 编译 的 第 1 阶段 ， 词 法 分 析 和 语法 分 析 





这 的 确 比较 容易 混淆 ， 但 通常 根据 上 下 文 还 是 能 够 区 别 的 。 词 法 分 析 和 语法 分 析 成 对 出 现时 ， 


























这 里 的 “ 语 ; 


分 析 ” 是 指 词 》 
成 、 链 接 等 并 列 出 现时 ， 指 的 则 是 包括 词 》 


























分 析 以 外 的 部 分 ， 即 狭义 的 语法 分 析 。 另 一 方面 ， 语 沪 
分 析 在 内 的 广义 上 的 语法 分 析 。 本 书 原 贝 


分 析 和 代码 生 
| 上 对 上 述 两 种 





情况 不 进行 区 分 ， 统 称 为 “语法 分 析 "。 在 需要 明确 区 分 时 ， 会 用 “狭义 的 语法 分 析 ” 和 “广义 的 





语法 分 析 ” 来 指 代 。 








扫描 器 的 动作 


， 能 将 词法 





百 


译 吉 的 词法 分 析 为 独立 的 模块 ， 但 语义 分 析 的 一 部 分 将 放 在 语法 分 析 的 








接着 ， 证 我 们 更 次 入 地 了 解 一 下 这 部 分 内 容 。 先 从 扫描 器 〈 即 词法 分 析 咒 ) 的 结构 开始 ， 


以 下 面 的 Cb 代码 为 例 。 


import stdio; 


IE 


main(int argc, 


char** argv) 


printf("Hello, World!Nn"); /* 打 个 招呼 吧 */ 
return 0; 
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这 就 是 所 谓 的 Hello,World ! 程序 。 扫 描 需 将 此 代码 分 割 为 如 下 的 单词 。 





import 
stdio 


printf 

( 

"Hello, World!\n" 
) 

Teturn 

0 


j 





需要 注意 的 是 ， 这 里 已 经 剔除 了 空白 符 、 换 行 以 及 注释 。 一 般 情 况 下 ,空白 符 和 注释 都 是 


在 词法 分 析 阶 段 进行 处 理 的 。 


单词 的 种 类 和 语义 值 

















扫描 融 的 工作 不 仅仅 是 将 代码 分 割 成 单词 ， 在 分 割 的 同时 还 会 失 


词 添加 语义 值 。 








算出 单词 的 种 类 ， 并 为 单 


单词 的 种 类 是 指 该 单词 在 语法 上 的 分 类 ， 例 如 单词 “54” 的 种 类 是 “整数 "。 
语义 值 (semantic value) 表示 单词 所 具有 的 语义 。 例 如 , 在 C 语言 中 ， 单词“54” 的 语义 
为 “数值 54”。 单 词 “"string"” 的 语义 为 “字符 串 "stzring""。 “printf” M "i" Wi 


义 有 可 能 是 函数 名 ， 也 有 可 能 是 变量 名 。 


所 以 ,为 了 表示 “整数 54”, 扫描 右 会 为 单词 “54” 








这 样 的 信息 。 该 信息 就 是 语义 值 。 单 词 “"Hello\n" 
SH «a? ee equ to “换行 符 ” 这 6 个 字符 ( 3.1 )。 





添加 “ 
”的 种 类 


x 
是 








个 单词 的 语义 是 数值 54" 
字符 串 ， 添 加 的 语义 值 为 
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图 3.1 单词 和 语义 值 











男 外 ， 也 有 一 些 单词 本 身 不 存在 语义 值 。 例 如 ， 对 于 保留 字 int 来 说 ,“ 保 留 字 int" X 
样 的 种 类 信息 已 经 完全 能 够 表示 语义 ,不 需要 额外 的 语义 值 。 





token 





在 编程 语言 处 理 系统 中 ， 我 们 将 “一 个 单词 ( 的 字面 》” 和 “ 它 的 种 类 ”“ 语 义 值 ”统称 为 
token。 通 过 使 用 token 这 个 词 ， 词 法 分 析 器 的 作用 就 可 以 说 是 解析 代码 (字符 行 ) 并 生成 token 
序列 。 

以 刚才 列举 的 Hello,World ! 程序 为 例 ，cbc 的 扫描 器 输出 的 token 序列 如 表 3.1 所 示 。 


表 3.1 Hello,World ! 的 词法 分 析 结 果 





































































































单词 种 类 语义 值 (无 语义 值 的 话 为 “-”) 
int 留 字 int s 

main 标识 符 "main" 

( ( - 

int 保留 字 int 

argc 标识 符 "argc" 

char 留 字 char 

argv 标识 符 "argv" 

) ) - 

{ { - 

printf 标识 符 "printf 

( ( - 

"Hello, World" 字符 串 "Hello, World n" 
) ) - 

return 保留 字 return 

0 整数 "o" 

} } - 
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cbe 中 使 用 - -dump- tokens 选项 就 可 以 显示 任意 代码 的 扫描 结果 的 token 序列 。 请 大 家 一 
定 自 己 试 着 用 cbe --dump-tokens 人 处理 各 类 代码 ， 看 一 下 会 生成 怎样 的 结果 。 


抽象 语法 树 和 节点 


编程 语言 的 编译 器 中 解析 器 的 主要 作用 是 解析 由 扫描 器 生 成 的 token 序列 ， 并 生成 代码 所 
对 应 的 树 型 结构 ， 即 语法 树 。 确 切 地 说 ， 也 有 方法 可 以 不 需要 生成 语法 树 ， 但 这 样 的 方法 仅 限 
于 极 小 型 的 编译 占 ， 因 此 本 书 予 以 省 上 略 。 

语法 树 和 语法 是 完全 对 应 的 ， 所 以 例如 C 语言 的 终结 符 分 号 以 及 表达 式 两 端的 括号 等 都 包 
会 在 真实 的 语法 树 中 。 但 是 ， 保 存 分 号 和 括号 基本 没有 实际 的 意义 ， 因 此 实际 上 大 部 分 情况 下 
会 生成 一 开始 就 省 略 分 号 、 括 号 等 的 抽象 语法 树 。 也 就 是 说 ， 解 析 咒 会 跳 过 语法 树 ， 直 接生 成 
抽象 语法 树 。 

无 论语 法 树 还 是 抽象 语法 树 ， 都 是 树 形 的 数据 结构 ， 因 此 和 普通 的 树 结构 相同 ， 由 称 为 节 
= (node) 的 数据 结构 组 合 而 成 。 用 Java 来 写 的 话 ， 一 个 节点 可 以 用 一 个 节点 对 象 来 表示 。 
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解析 器 生成 器 








本 节 我 们 将 了 解 自 动 生 成 解析 需 的 工具 。 


F3 什么 是 解析 器 生成 器 


手动 编写 扫描 需 或 解析 器 是 一 件 非 常 无 聊 旦 葡 琐 的 事情 ， 原 因 在 于 不 得 不 反复 编写 同样 的 
代码 。 而 且 手 动 编写 扫描 需 或 解析 器 的 话 ， 将 很 难 理解 要 解析 的 究竟 是 一 种 怎样 的 语法 。 

因此 ， 为 了 使 工作 量 和 可 读 性 两 方面 都 有 所 改善 ， 人 们 对 自动 生成 扫描 器 和 解析 器 的 方法 
进行 了 研究 。 生 成 扫描 需 的 程序 称 为 扫描 器 生成 器 (scanner generator )， 生 成 解析 需 的 程序 称 为 
解析 器 生成 器 (parser generator )。 只 需 指 定 需要 解析 的 语法 ， 扫 描 需 生成 融和 解析 器 生成 需 就 
能 生成 解析 相应 语法 的 代码 。 

cbe 使 用 名 为 JavaCC 的 工具 来 生成 扫描 器 和 解析 器 。JavaCC 兼 具 扫 描 需 生成 器 和 解析 器 
生成 妖 的 功能 ， 因 此 能 够 在 一 个 文件 中 同时 记述 扫描 融和 解析 器 。 


[了 洒 解 析 器 生成 器 的 种 类 


扫描 器 生成 器 都 大 体 类 似 ， 解 析 器 生成 器 则 有 若干 个 种 类 。 现 在 具有 代表 性 的 解析 器 生成 
器 可 分 为 LL 解析 器 生成 器 和 LALR 解析 器 生成 器 两 类 。 

这 样 划 分 种 类 的 依据 是 解析 器 生成 器 能 够 处 理 的 语法 的 广度 。 解析 器 生成 器 并 非 能 够 处 理 
所 有 语法 ， 有 着 其 自身 的 局 限 性 。 可 以 说 这 种 局 限 性 越 小 ， 能 够 处 理 的 语法 就 越 广 。 

一 般 的 解析 需 生 成 器 的 种 类 如 表 3.2 所 示 。 大 家 可 以 结合 该 表 来 阅读 下 面 的 内 容 。 一 般 来 
说 ， 能 够 处 理 的 语法 范围 最 广 的 解析 器 生成 带 是 LR 解析 需 生 成 器 。 但 是 因为 LR 解析 需 生 成 需 
的 速度 非常 缓慢 ， 所 以 出 现 了 通过 稍微 缩减 可 处 理 的 语法 范围 来 提高 效率 的 解析 需 生 成 器 ， 那 
就 是 LALR 解析 需 生 成 器 。 而 LL 解析 需 生 成 器 比 LALR 解析 需 生 成 器 的 结构 更 简单 、 更 易于 
制作 ， 但 可 处 理 的 语法 范围 也 更 小 。 

表 3.2 解析 器 生成 器 的 种 类 
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种 类 可 处 理 的 语法 范围 速度 
LR 解析 器 生成 器 广 一 般 
LALR 解析 器 生成 器 相对 狭窄 一 般 
LL 解析 器 生成 器 TES 较 快 
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LALR 解析 融和 生成 右 能 够 处 理 的 语法 范围 比 LL 要 广泛 很 多 ， 加 上 现 有 的 编程 语言 几乎 都 属 
于 LALR 语法 ， 因 此 解析 需 生 成 器 长 期 以 来 都 是 以 LALR 解析 需 生 成 天 为 主 。 而 最 具 代 表 性 的 
LALR 解析 吉 生 成 器 就 要 数 UNIX 上 的 yacc To 

但 最 近 从 解析 器 的 易 理解 性 和 可 操作 性 来 看 ，LL 解析 器 生成 器 的 势头 正在 恢复 。 本 书 所 用 
的 JavaCC 就 是 面向 Java 的 LL 解析 器 生成 央 。 


解析 器 生成 器 的 选择 
































BR JavaCC 之 外 ， 还 有 很 多 其 他 的 解析 需 生 成 器 。 表 3.3 中 列举 了 各 语言 具有 代表 性 的 解析 
表 3.3 各 类 解析 器 生成 器 





















































软件 名 能 够 生成 解析 器 的 语言 可 处 理 语法 的 范围 
ANTLR Java, C, C++ 等 多 数 语言 L(*) 
JavaCC Java LL(K) 
jay Java LALR(1) 
yacc C LALR(1) 
bison C LALR(1) 
myacc C, Java. JavaScript. Perl LALR(1) 
Lemon C LALR(1) 
Parse::RecDecendent Perl LET} 
Racc Ruby LALR(1) 
Parsec Haskell LL(K) 
happy Haskell LALR(1) 














在 “可 处 理 语 法 的 范围 ”一 列 中 ， 有 的 像 LALR() 这 样 ， 标 注 了 (1) 这 样 的 数字 。 这 表示 


能 够 超前 扫描 的 token 数 ， 其 中 (Kk) 或 (9) 表示 能 够 超前 扫描 任意 个 数 。 基 本 上 可 以 认为 这 个 数 
字 越 大 解析 器 生成 器 的 功能 就 越 强 。 也 就 是 说 ， 同 样 为 LL 解析 器 生成 器 ， 比 起 LL(GD)，LLGO 
或 者 LL) 要 更 强大 。 有 关 token 的 超前 扫描 的 内 容 将 在 第 5 章 进行 讲解 。 

另外 ，cbc 选择 JavaCC 作为 解析 器 生成 器 的 原因 有 如 下 4 个 。 

e 具备 了 所 必需 的 最 低 限度 的 功能 

e 运行 生成 的 解析 器 时 不 需要 专门 的 库 

e 软件 的 实现 比较 成 熟 

e 生成 的 代码 还 算是 可 读 的 

但 是 大 家 在 制作 解析 器 时 不 必 局 限于 JavaCC。 只 要 学 会 使 用 一 个 解析 器 生成 器 ， 学 习 其 他 
的 解析 器 生成 器 也 就 变 得 容易 了 。 通 过 本 书 理解 了 JavaCC 的 优 缺 点 后 ， 也 请 大 家 试 着 研究 一 下 
其 他 生成 器 。 
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ac^ 


? 编译 器 的 编译 器 


有 些 人 将 解析 器 生成 器 称 为 编译 器 的 编译 器 ( compiler compiler ), JavaCC 的 CC 也 是 “编译 
器 的 编译 器 ”的 略称 ，yacc 的 CC 也 是 。 这 里 解释 一 下 “编译 器 的 编译 器 ”这 个 说 法 。 

顾名思义 ， 编 译 器 的 编译 器 是 指 生成 编译 器 的 编译 器 。 只 要 确定 编程 语言 的 规格 和 CPU 的 规 
格 ， 就 能 生成 供 这 个 CPU 使 用 的 特定 编程 语言 的 编译 器 。 关 于 编译 器 的 编译 器 这 个 想法 ， 最 早 从 
20 世纪 60 年 代 人 们 就 开始 研究 了 。 
有 了 编译 器 的 编译 器 ， 就 能 简单 地 制作 编译 器 ， 非 常 方便 。 但 
非常 困难 的 事情 。 人 能 够 实际 使 用 的 编译 器 的 编译 器 至 今 尚未 出 现 。 
但 作为 制作 编译 器 的 编译 器 的 研究 成 果 ， 我 们 已 知道 编译 器 中 的 一 部 分 可 以 相对 容易 地 自动 生 
Ro "可 以 相对 容易 地 自动 生成 的 部 分 ”就 是 扫描 器 和 解析 器 。 由 于 编译 器 的 编译 器 一 直 无 法 投入 
实际 应 用 ， 而 只 有 扫描 器 生成 器 和 人 解析 器 生成 器 逐渐 走红 ， 不 知 从 何 时 开始 ， 扫 描 器 生成 器 和 解析 
器 生成 器 就 被 称 为 编译 器 的 编译 器 了 。 
但 事实 上 ， 解 析 器 生成 器 生成 的 是 解析 器 ， 并 非 编译 器 ， 因 此 将 解析 器 生成 器 称 为 编译 器 的 编 
译 器 就 有 点 言 过 其 实 了 ， 还 是 称 之 为 解析 器 生成 器 比较 合适 ， 至 少 笔者 是 这 么 认为 的 。 






























































司 时 制作 编译 器 的 编译 器 也 是 件 
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JavaCC 的 概要 











本 书 中 的 Cb 编译 器 使 用 名 为 JavaCC 的 工具 来 生成 解析 器 。 本 节 就 对 JavaCC 进行 简单 的 
说 明 。 


什么 是 JavaCC 


JavaCC 是 Java 的 解析 器 生成 器 兼 扫描 器 生成 器 。 为 JavaCC 描述 好 语法 的 规则 ，JavaCC 就 
能 够 生成 可 以 解析 该 语法 的 扫描 天 和 解析 器 〈 的 代码 ) 了 。 

JavaCC 是 LL 解析 需 生 成 锅 ， 因 此 比 起 LR 解析 需 生 成 融和 LALR 解析 需 生 成 咒 ， 它 有 着 
可 处 理 语法 的 范围 相对 狭窄 的 缺点 。 但 另 一 方面 ，JavaCC 生成 的 解析 器 有 易于 理解 、 易 于 使 用 
的 优势 。 另 外 ， 因 为 文 持 了 “无 限 长 的 token 超前 扫描 *"， 所 以 可 处 理 语 法 范围 狭窄 的 问题 也 得 
到 了 很 好 的 改善 ， 这 一 点 将 在 第 5 章 中 介绍 。 


PJ 语法 描述 文件 
语法 规则 通常 会 用 一 个 扩展 名 为 “. jj” 的 文件 来 描述 ， 该 文件 称 为 语法 描述 文件 。cbe 中 


在 名 为 Parser .jj 的 文件 中 描述 语法 。 
一 般 情况 下 ， 语 法 描述 文件 的 内 容 多 采用 如 下 形式 。 












































了 








options [( 
JavaCC 的 选项 
} 


PARSER BEGIN( 解析 器 类 名 ) 
package B% ; 
import 库 名 ; 








public class 解析 器 类 名 { 
任意 的 Java 代码 





PARSER_END ( 解析 器 类 名 ) 











扫描 器 的 持 








x 
x 
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语法 描述 文件 的 开头 是 描述 JavaCC 选项 的 options 块 ， 这 部 分 可 以 省 略 。 

JavaCC 和 Java 一 样 将 解析 器 的 内 容 定 义 在 单个 类 中 ， 因 此 会 在 PRARSER_BEGIN 和 
PARSER END 之 间 描 述 这 个 类 的 相关 内 容 。 这 部 分 可 以 描述 package 声明 、import 声明 以 
及 任意 的 方法 。 

在 此 之 后 是 扫描 器 的 描述 和 解析 器 的 描述 。 这 部 分 的 内 容 将 在 以 后 的 章节 中 详细 说 明 ， 这 
里 暂且 省 略 。 


F3 语法 描述 文件 的 例子 

如 果 完 全 没有 例子 将 很 难 理解 语法 描述 文件 ， 因 此 这 里 举 一 个 非常 简单 的 例子 。 如 代码 清 
单 3.1 所 示 ， 这 是 一 个 只 能 解析 正 整数 加 法 运算 并 进行 计算 的 解析 器 的 语法 描述 文件 。 请 大 家 
粗略 地 看 一 下 ， 只 要 对 内 容 有 大 致 的 了 解 就 行 了 。 
代码 清单 3.1  Adder jj 














options ( 
STATIC - false; 


) 


PARSER BEGIN (Adder) 
import java.io.*; 


class Adder ( 
static public void main(String[] args) ( 
for (String arg : args) ( 
try { 
System.out.println(evaluate (arg)); 
) 


catch (ParseException ex) ( 
System.err.println(ex.getMessage()); 


) 
} 


static public long evaluate(String src) throws ParseException [ 
Reader reader - new StringReader(src); 
return new Adder(reader).expr(); 


PARSER END (Adder) 


SKIP: ( «[" "nye", "Ny, nNpn] > } 


TOKEN: { 
«INTEGER: (["0"-"9"])+> 


) 


long expr(): 
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Token x, y; 


X-«INTEGER» "+" y-«INTEGER» «EOF» 


{ 
) 


return Long.parseLong(x.image) + Long.parseLong(y.image); 


在 一 开始 的 options 块 中 , 将 STATIC 选项 设置 为 false。 将 该 选项 设置 为 true 的 话 ， 
JavaCC 生成 的 所 有 成 员 及 方法 都 将 被 定义 为 static. 

若 将 STATIC 选项 设置 为 trzue， 那 么 所 生成 的 解析 需 将 无 法 在 多 线程 环境 下 使 用 ， 因 此 
该 选项 应 该 总 是 被 设置 成 false。 比 较 麻 烦 的 是 ，sTATIC 选项 的 默认 值 是 true， 因 此 无 法 
省 略 该 选项 ， 必 须 明 确 地 将 其 设置 为 false。 

接着 ， 从 PARSER BEGIN (Adder ) 到 PARSER END (Adder ) 是 解析 器 类 的 定义 。 解 析 
需 类 中 需要 定义 的 成 员 和 方法 也 写 在 这 里 。 为 了 实现 即使 只 有 adder 类 也 能 够 运行 ， 这 里 定义 
T main 函数 。main 也 数 的 内 容 将 稍 后 讲解 。 

之 后 的 SKIP 和 TOKEN AMEX T HHA SKIP 表示 要 跳 过 空格 MKI (tab) 和 换行 
符 。TOKEN 表示 扫描 整数 字符 并 生成 token。 

从 long expr... 开始 到 最 后 的 部 分 定义 了 狭义 的 解析 器 。 这 部 分 解析 token 序列 并 执行 
某 些 操作 。cbc 生成 抽象 语法 树 ， 但 adder 类 并 不 生成 抽象 语法 树 ， 而 是 直接 计算 表达 式 的 
结果 。 


运行 JavaCC 


要 用 JavaCC 来 处 理 Adder .jj， 需 使 用 如 下 javacc 命令 。 

















$ javacc Adder.jj 

Java Compiler Compiler Version 4.0 (Parser Generator) 
(type "javacc" with no arguments for help) 

Readingi om coe 





File "TokenMgrError.java" does not exist. Will create one. 
File "ParseException.java" does not exist. Will create one. 
pile Urakea jewal coss moe ewlets Will Create ome 


File "SimpleCharStream.java" does not exist. Will create one. 
Parser generated successfully. 

$ ls Adder.* 

Adder.Java  Adder.jj 


除了 输出 上 述 消息 之 外 ， 还 会 生成 Adder .java 和 其 他 的 辅助 类 
要 编译 生成 的 Adder .java， 只 需要 javac 命令 即 可 。 输 AMFÉ&A mGDEGAR. 
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$ javac Adder.java 
$ ls Adder.* 
Adder.class  Adder.java  Adder.jj 


这 样 就 生成 了 Adder.class 文件 。 
让 我 们 马上 试 着 执行 一 下 。Adder 类 是 从 命令 行 参数 获取 计算 式 并 进行 计算 的 ， 因 此 可 以 
如 下 这 样 从 命令 行 输入 计算 式 并 执行 。 


java Adder '1+5' 


java Adder '300 + 1234' 


$ 
6 
$ java Adder '1 + 5' 
6 
$ 
1534 


可 见 已 经 能 很 好 地 进行 加 法 运算 了 。 


启动 JavaCC 所 生成 的 解析 器 


结束 前 ， 我 们 来 了 解 一 下 main 函数 的 代码 。 首 先 ， 代 人 码 清单 3.2 中 再 一 次 给 出 了 
main PRAES As 
代码 清单 3.2 Adders&main 函数 ( Adder.java ) 





static public void main(String[] args) ( 
for (String arg : args) ( 


try { 
System.out.println(evaluate (arg)); 
) 


catch (ParseException ex) ( 
System.err.println(ex.getMessage()); 


} 
} 


该 函数 将 所 有 命令 行 参 数 的 字符 串 作 为 计算 对 象 的 算式 ,依次 用 evaluate 方法 进行 计 
算 。 例 如 从 命令 行 输入 参数 "1 + 3"，evaluate 方法 就 会 返回 4， 之 后 只 需 用 System. out. 
println 方法 输出 结果 即 可 。 

下 面 所 示 的 是 evaluate 方法 的 代码 。 
代码 清单 3.3  Adderstevaluate 方法 ( Adder.java ) 





static public long evaluate(String src) throws ParseException [ 
Reader reader - new StringReader(src); 
return new Adder(reader).expr(); 


) 
该 方法 中 生成 了 Agdder 类 (解析 带 类 ) 的 对 象 实例 ， 并 让 adder 对 象 来 计算 Or) 2 
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数字 符 串 src. 
要 运行 JavaCC 生成 的 解析 器 类 ， 需 要 下 面 2 个 步骤 。 
生 


1. 生成 解析 器 类 的 对 象 实例 
2. 用 生成 的 对 象 调用 和 需要 解析 的 语句 同名 的 方法 


首先 说 一 下 第 1 点 。JavaCC 4.0 生成 的 解析 器 中 默认 定义 有 如 下 4 种 类 型 的 构造 函数 。 









































1. Parser(nputStream s) 


2. Parser(InputStream s, String encoding) 


3. Parser(Reader r) 


( 
( 
( 
4. Parser( x x x x TokenManager tm) 

第 1 种 形式 的 构造 函数 是 通过 传人 和信 InputStream 对 象 来 构造 解析 器 的 。 这 个 构造 函数 无 
法 设 定 输入 字符 串 的 编码 ， 因 此 无 法 处 理 中 文字 符 等 。 

而 第 2 种 形式 的 构造 函数 除了 InputStream 对 象 之 外 ， 还 可 以 设置 输入 字符 串 的 编码 来 
生成 解析 器 。 如 果 要 使 解析 器 能 够 解析 中 文字 符 串 或 注释 的 话 ， 就 必须 使 用 第 2 种 或 第 3 种 构 
造 函 数 。 但 如 下 所 示 ， 如 果 要 处理 中 文字 符 串 ， 仅 靠 改 变 构造 函数 是 不 够 的 。 

第 3 种 形式 的 构造 函数 用 于 解析 Reader 对 象 所 读 入 的 内 容 。Adger 类 中 就 使 用 了 该 形式 。 

第 4 种 形式 是 将 扫描 器 作为 参数 传人 。 如 果 是 要 解析 字符 串 或 文件 输入 的 内 容 ， 没 有 必要 
使 用 该 形式 的 构造 函数 。 

解析 器 生成 后 ， 用 这 个 实例 调用 和 需要 解析 的 语法 (正确 地 说 是 标识 符 ) 同名 的 方法 。 这 
EJH adder 类 实例 的 expr 方法 ， 就 会 开始 解析 ， 解 析 正 党 结束 后 会 返回 语义 值 。 


[F3 中 文 的 处 理 

下 面 讲 解 一 下 用 JavaCC 处 理 带 有 中 文字 符 的 字符 串 的 方法 。 

要 使 JavaCC 能 够 正确 处 理 中 文 ， 首 先 需 要 将 语法 描述 文件 的 options AJ UNICODE 
INPUT 选项 设置 为 true， 如 代码 清单 3.4 所 示 。 


代码 清单 3.4 options $ ( parser/Parser.jj ) 



































options { 
STATIC = false; 
DEBUG PARSER = true; 
UNICODE INPUT = true; 
JDK VERSION = "1.5"; 











这 样 就 会 先 将 输入 的 字符 串 转换 成 UNICODE 后 再 进行 处 理 。UNICODE INPUT 选项 为 
false 的 情况 下 只 能 处 理 ASCII 范围 内 的 字符 。 
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另外 ,使 用 刚才 列举 的 构造 函数 的 第 2 种 或 第 3 种 形式 ， 为 输入 的 字符 串 设置 适当 的 编码 。 
使 用 第 3 种 形式 的 情况 下 ， 在 Reader 类 的 构造 函数 中 指定 编码 。 

编码 所 对 应 的 名 称 请 见 表 3.4。 这 样 即使 包含 中 文字 符 的 代码 也 能 够 正常 处 理 了 。 
表 3.4 编码 的 名 称 























编码 JavaCC 的 构造 函数 所 对 应 的 名 称 
UTF-8 "UTF-8" 

GB2312 'gb2312" 

GBK "gbk" 

















词法 分 析 


本 章 将 先 介绍 基于 JavaCC 的 词法 分 析 的 相关 
内 容 ， 之 后 再 介绍 Cb 的 扫描 器 的 实现 。 
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基于 JavaCC 的 扫描 器 的 描述 








本 节 将 结合 cbe 的 扫描 带 的 代码 ， 来 介绍 基于 JavaCC 描述 扫描 带 的 方法 。 


本 章 的 目的 


第 3 章 中 已 经 介绍 过 扫描 器 的 作用 ， 扫 描 器 是 将 由 编程 语言 描述 的 代码 切 分 成 单词 ， 并 同 
时 给 出 单词 的 语义 值 。 换 言 之 ， 就 是 给 出 token 序列 。 

那么 要 怎样 用 JavaCC 来 制作 目标 语言 的 扫描 需 呢 ?7 JavaCC 采用 正则 表达 式 (regular 
express ) 的 语法 来 描述 需要 解析 的 单词 的 规则 ， 并 由 此 来 表现 扫描 器 。 

正则 表达 式 是 以 指定 字符 串 模 式 为 目的 的 微型 语言 。Linux 上 的 grep 命令 、awk 命令 、 
Perl 等 ， 很 多 情况 下 都 可 以 使 用 正则 表达 式 ， 因 此 知晓 什么 是 正则 表达 式 的 人 还 是 比较 多 的 。 
如 果 还 不 知道 正则 表达 式 ， 也 请 借 此 机 会 试 着 学 习 一 下 。 

另外 ，JavaCC 的 正则 表达 式 和 grep 等 所 使 用 的 正则 表达 式 即 便 功 能 相同 ， 字 面 表述 也 完 
全 不 一 样 。 直 接 使 用 grep 等 的 正则 表达 式 的 话 ， 将 无 法 按照 预期 正常 运行 ， 这 点 请 注意 。 


JavaCC 的 正则 表达 式 



































我 们 来 讲解 一 下 JavaCC 所 使 用 的 正则 表达 式 。 首 先 ，JavaCC 的 正则 表达 式 能 够 描述 的 模 
式 如 表 4.1 所 示 。 


表 4.1 JavaCC 的 正则 表达 式 

























































































种 类 示例 

习 定 字符 串 "int" 

连接 "ABC" *XYZ' 
字符 组 CAREAT 
限定 范围 的 字符 组 "0"-"9"] 
排除 型 字符 组 mX Y" Z] 
任意 一 个 字符 -[ 

重复 0 次 或 多 次 TD 

重复 1 次 或 多 次 "o")+ 

重复 n 次 到 m 次 "0)0,3) 
重复 n 次 "0"){3} 

可 以 省 略 "Ox")? 

选择 "ABC'XYZ" 
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下 面 按 顺 序 详 细 讲解 。 
F3 国定 字符 串 

JavaCC 中 要 描述 “和 字符 串 自 身 相 匹配 的 模式 ”时 ， 可 以 用 双 引 号 ("" ) 括 起 来 ， 比 如 像 
"int" 和 "long" 这 样 。 


这 里 的 “匹配 ”是 “适合 ”“ 符 合 ”的 意思 。 当 字符 串 很 好 地 符合 由 正则 表达 式 摘 述 的 字符 
串 模式 时 ， 就 可 以 说 “字符 串 匹 配 模式 ”。 例 如 字符 串 "int" 匹配 模式 "int"。 


FJ 连接 
像 "ABC" 之 后 接着 "XYZ" 这 样 表示 模式 连续 的 情况 下 ， 只 需 接 着 上 一 个 模式 书写 即 可 。 
例如 "ABC" 之 后 接着 "XYZ" 的 模式 如 下 所 示 。 




















"ABC" "XYZ" 


像 这 样 由 连续 模式 表现 的 正则 表达 式 的 模式 称 为 连接 ( sequence ). 

上 面 的 例子 是 固定 字符 串 的 连接 ， 因 此 写成 "ABCXYZ" 也 是 一 样 的 。 当 和 之 后 讲述 的 模式 
组 合 使 用 时 ， 连 接 模 式 就 能 够 体现 其 价值 。 
F3 字符 组 

想 要 表示 “特定 字符 中 的 任 一 字符 ”时 ， 可 以 使 用 方 括号 ,， 像 ["X"，"Y"，"2"] 这 样 表 
示 ， 该 模式 匹配 字符 "X" 或 "Y" 或 "2"。 像 这 样 指 定 字符 的 集合 称 为 字符 组 (character class )。 

还 可 以 用 中 划 线 “-” 来 指定 字符 的 范围 。 例 如 ["0"- "9"] 表示 字符 "o" 到 "9" 范围 内 
包含 的 字符 都 能 够 匹配 。 也 就 是 说 ， 它 和 ["O","1","2","3", "r4", "5n, "gn, "7", "g", non] 
是 相同 的 。 

也 可 以 组 合 使 用 “,” 和 “-”。 例如 标识 符 中 能 够 使 用 的 字符 ( 字母、 数字 或 下 划 线 ) 可 以 
如 下 这 样 描述 。 





























/排除 型 字符 组 

















字符 组 通过 指定 集合 中 包含 的 字符 来 表现 字符 集合 ， 反 之 也 可 以 指定 集合 中 不 包含 的 字符 。 
也 就 是 说 ， 能 够 描述 像 “ 数 字 之 外 的 所 有 字符 ”这 样 的 模式 。 这 样 的 模式 称 为 排除 型 字符 组 


( negated character class )。 
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排除 型 字符 组 的 写法 如 下 所 示 ， 通 常 是 在 字符 组 前 面 加 上 “~”。 


这 样 就 能 表示 "X"、"Y"、"z" 以 外 的 字符 。 
下 面 的 写法 能 够 表示 任意 一 个 字符 ， 这 是 非常 实用 的 排除 型 字符 组 的 用 法 。 
~[] 
“[] ”是 不 包含 任何 字符 的 字符 组 ， 因 此 将 其 反 转 就 是 包含 所 有 字符 。 
F] 重复 1 次 或 多 次 
JavaCC 的 正则 表达 式 能 够 描述 一 个 模式 的 重复 ， 分 为 重复 0 次 或 多 次 和 重复 1 次 或 多 次 。 


我 们 先 从 重复 1 次 或 多 次 开始 讲解 。 
例如 ， 要 描述 字符 "xt 重复 1 次 或 多 次 ， 可 如 下 这 样 使 用 “+”。 





























("x")+ 


"x" 两 侧 的 括号 无 论 在 何 种 模式 下 都 是 必需 的 ， 这 点 请 注意 。 
上 述 模式 匹配 "x" 重复 1 次 或 多 次 ， 即 和 “x”“xx”“xxxxxxx” 等 匹配 。 


重复 0 次 或 多 次 


如 果 要 描述 重复 0 次 或 多 次 ， 可 以 如 下 这 样 使 用 “*”。 




















("x")* 


使 用 “* ”时 两 侧 的 括号 也 是 必 不 可 少 的 。 该 模式 和 “x” "xx" "xxxxxx" DUE UU CAE 
符 ) 匹配 。 

和 空 字 符 匹 配 ， 这 也 是 “*” 的 关键 之 处 〈 同时 也 是 问题 )。 例 如 ， 调 查 一 下 模式 ("y")* 
和 字符 串 xxx 的 开头 是 否 匹 配 。 字 符 串 xxx 中 一 个 xy 字符 也 没有 ， 因 此 感觉 是 不 匹配 的 ， 但 
实际 是 ("y")* 和 xxx 的 开头 匹配 。 原 因 是 字符 串 xxx 的 开头 可 以 看 作 是 长 度 为 0 的 空 字符 。 

像 这 样 错 误 地 使 用 “* ”很 容易 产生 奇怪 的 现象 。 在 使 用 “* ”时 要 注意 ， 结 合 其 他 的 模式 ， 
模式 整体 不 能 在 不 经 意 之 间 和 空 字符 串 匹 配 。 


FJ 重复 n 次 到 m 次 
“重复 0 次 或 多 次 ”和 “重复 1 次 或 多 次 ”都 是 重复 次 数 上 限 不 国定 的 模式 ，JavaCC 的 正则 表 
达 式 还 可 以 描述 “重复 n 次 到 m 次 ”的 模式 。 要 描述 重复 n 次 到 m 次 ,可 以 如 下 这 样 使 用 {n,m} 
































("o") {3,9} 
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该 模式 和 3 个 至 9 个 字符 的 o 相 匹配 。 匹 配 的 字符 串 的 例子 有 "ooo" "oooooo "ooooooooo ”等 。 


正好 重复 n 次 


JavaCC 的 正则 表达 式 也 可 以 描述 “正好 重复 mn 次 "。 如 下 所 示 ， 使 用 (n) 来 描述 正好 重复 n 次 。 








(["0"-"7"]) (3) 


该 模式 和 3 个 0 到 7 范围 内 的 数字 字符 相 匹 配 。 匹 配 的 字符 串 的 例子 有 “000”“345”“777” 等 。 
FJ 可 以 省 略 
要 表示 某 个 模式 出 现 0 次 或 1 次 ， 即 可 以 省 略 ， 如 下 这 样 使 用 “?” 即 可 。 














("0x")? 
上 述 模式 描述 了 "ox" 是 可 有 可 无 〈 可 以 省 略 ) 的 。 还 要 注意 的 是 两 侧 的 括号 是 必需 的 。 
例如 很 多 语言 中 的 整数 字面 量 能 够 添加 正 号 和 负 号 ,但 也 可 以 省 略 。 这 样 的 模式 可 以 如 下 

这 样 描述 。 





























该 模式 和 和 “5”“+1”“-35” 等 匹配 。 
[E 选择 


最 后 的 模式 是 “选择 ”， 能 够 描述 “A 或 者 B 或 者 C” 这 样 “ 选 择 多 个 模式 中 的 一 个 ”的 模式 。 
例如 描述 “"ABC" 或 者 "XYz"”， 如 下 这 样 使 用 坚 线 “|” 即 可 。 











请 注意 “|” 的 优先 级 非常 低 。 例 如 有 如 下 这 样 的 模式 ， 你 知道 选择 对 象 的 范围 是 从 哪里 到 
哪里 吗 ? 





"A" "pg" | mcr vpn 
正确 的 答案 是 “模式 全 体 ”， 即 如 下 这 样 解读 。 
OIC 


而 不 是 像 下 面 这 样 只 是 将 "B" 和 "or 作为 选择 的 对 象 。 











"AM ("B" | non) "p" 


如 果 想 按 上 述 这 样 解读 的 话 ， 要 明确 地 用 括号 括 起 来 。 
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扫描 没有 结构 的 单词 











从 本 节 开 始 我 们 将 实际 使 用 JavaCC 来 制作 cbe 的 扫描 器 。 
首先 来 看 一 下 用 JavaCC 的 TOKEN 命令 对 最 简单 的 标识 符 和 保留 字 进 行 扫描 的 方法 。 





TOKEN 命令 
JavaCC 中 扫描 token 要 像 下 面 这 样 使 用 TOKEN 命令 (TOKEN directive )， 并 排 记载 token 
名 和 正则 表达 式 。 





TOKEN: ( 
«token 1 : 正则 表达 式 1> 
| «token 名 2 : 正则 表达 式 2> 
«token 名 3 : 正则 表达 式 3> 





«token n : 正则 表达 式 n> 


这 样 记 载 后 就 会 生成 扫描 硕 ， 扫 描 顺 扫描 符合 正则 表达 式 模 式 的 字符 串 并 生成 对 应 的 
token, 

并 且 TOKEN 命令 的 块 在 一 个 文件 中 可 以 出 现任 意 多 次 ， 因 此 按照 逻辑 上 的 相关 性 分 开 记 载 
TOKEN 命令 比较 好 。 


扫描 标识 符 和 保留 字 


cbe 中 扫描 标识 符 和 保留 字 的 部 分 是 最 简单 的 ， 下 面 让 我 们 一 起 来 看 一 下 这 部 分 的 代码 示例 
( 代码 清单 4.1 )。 
代码 清单 4.1 扫描 标识 符 和 保留 字 ( parser/Parser.jj ) 











TOKEN: ( 
«VOID : "void"> 
| «CHAR : "char"> 
| «SHORT : "Short'- 
| «INT ;: "int" 
| «LONG : "long" 
| «STRUCT : "struct"> 
| 


<UNION : "UnLon™s 
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<ENUM z "enum"» 
«STATIC : "statics 
«EXTERN s cUextern"s 
«CONST : "const" 
«SIGNED : "signed"> 
«UNSIGNED : "unsigned" > 
«IF :sOWQfUS 
«ELSE : "else" 
«SWITCH : "Switch"» 
«CASE s: "case"»s 
«DEFAULT : "default"> 
<WHILE : "while"> 
<DO : "do"s 
«FOR z "for"s 
«RETURN z "return"s 
«BREAK : "break" 
«CONTINUE : "continue"» 
«GOTO : "goto" 
«TYPEDEF : "typedef"- 
«IMPORT : "import'"2 
«SIZEOF : "Sizeof"s 

} 

TOKEN: { 

«IDENTIFIER: ["a"-"z", "A"-"Z", " "] (["a"-"zg", "A"-"gn, m w, mQn-"gu])*, 


) 


第 1 个 TOKEN 命令 描述 了 保留 字 的 规则 ， 第 2 个 TOKEN 命令 描述 了 标识 符 的 规则 。 保 留 
字 的 正则 表达 式 都 是 固定 字符 串 的 模式 ， 很 容易 理解 。 意 思 是 发 现 固定 字符 串 "void" 就 生成 














划 线 ， 第 2 个 字符 及 以 后 是 字母 、 下 划 线 或 数字 这 样 的 规则 。 


选择 匹配 规则 


严谨 地 思考 一 下 的 话 ， 刚 才 说 明 的 内 容 其 实 存在 模棱两可 之 处 。 例 如 ， 代 码 中 写 有 
voidFunction 的 话 会 生成 何 种 token E? 理想 的 情况 当然 是 生成 IDENTIFIER 的 token， 但 
开头 的 void 部 分 和 VOID token 的 正则 表达 式 匹配 ， 所 以 也 有 可 能 生成 VOID token. 

事实 上 voidFunction 不 会 生成 VOID 的 token。 原 因 是 JavaCC 会 同时 尝试 匹配 所 有 的 
正则 表达 式 ， 并 选择 匹配 字符 串 最 长 的 规则 。voidFunction fl VOID token 的 正则 表达 式 匹 
配 的 部 分 是 只 有 4 个 字符 的 void， 而 IDENTIFIER token 的 正则 表达 式 和 voidFunction 
的 12 个 字符 匹配 。12 个 字符 比 4 个 字符 长 ， 因 此 对 于 voidFunction,， JavaCC 会 生成 
IDENTIFIER token。 
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那么 和 多 个 规则 的 正则 表达 式 匹 配 的 字符 串 长 度 相同 的 情况 下 又 会 怎样 呢 ? 例如 代码 void 
£(), ， 和 VOID token 以 及 IDENTIFIER token 的 正则 表达 式 都 匹配 void 这 4 个 字符 。 

像 这 样 和 多 个 规则 的 正则 表达 式 匹 配 的 字符 串 长 度 相 同 的 情况 下 ，JavaCcC 优先 选择 在 
文件 中 先 定义 的 token 规则 。 也 就 是 说 ， 如 果 VOID token 的 规则 写 在 IDENTIFIER token 
规则 之 前 ， 那 么 生成 VoID token。 而 如 果 IDENTIFIER token 的 规则 先 定义 的 话 ， 则 生成 





IDENTIFIER token, 
因此 ， 如 果 将 IDENTIFIER token 的 规则 定义 写 在 保留 字 的 规则 之 前 ， 那 么 所 有 保留 字 都 会 
被 扫描 成 为 IDENTIFIER token， 所 以 所 有 保留 字 的 规则 必须 在 写 在 IDENTIFIER 的 规则 之 前 。 


[y 扫描 数值 
作为 使 用 TOKEN 命令 的 另 一 个 例子 ， 我 们 来 看 一 下 扫描 数值 的 代码 。cbe 中 相应 部 分 的 代 


码 如 代码 清单 4.2 所 示 。 
代码 清单 4.2 ”扫描 数值 ( parser/Parser.jj ) 








TOKEN: { 
«INTEGER: ["1"-"9"] (["O"-"9"])* ("U")? ("L")? 
| "o" ["x", "X"] (["O"-"9", "a"-"f", "A"-"E"]). ("U")? ("L")? 
| om qu phonsmgwiyw. (ngmye. qupwy 


> 


这 次 的 正则 表达 式 稍微 有 些 复杂 ， 我 们 试 着 将 其 分 解 后 来 看 。 
首先 是 下 列 3 个 正则 表达 式 的 组 合 ， 从 上 到 下 分 别 是 十 进 制 、 十 六 进 制 、 八 进 制 的 数值 字 
面 量 的 模式 。 



































Hannon CPO ne ("U")? ("L")? 
0 [ "x" "xX"] (["ort-ror, Wes Eu. "A"-"pP"])+ ("U")? ("L")? 
0 (["0 -"jg"])x* ("0")? ("L")? 


上 述 各 个 正则 表达 式 中 用 到 的 模式 有 下 面 这 些 。 


["1"-"9"] 
0 以 外 的 1 位 数字 
["0"-"9"] 


任意 1 位 数字 
(["0"-"9"])* 

任意 的 数字 ，0 位 或 多 位 排列 
("U")? 

可 省 略 的 字符 "U" 
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("L")? 

可 省 略 的 字符 "L， 

["x*, "X"] 

字符 "x" 或 字符 nx 

["o"-"9", nan- ngn, "An-"F"] 

任意 1 位 数字 或 af、A~F 的 任意 1 个 字符 ( 十 六 进 制 的 字符 ) 

(["0n-"9»,nan-nfn,nan-npn]), 

十 六 进 制 字符 1 位 或 多 位 排列 

["0"-"7"] 

0 到 7 的 1 位 数字 (入 进 制 的 字符 ) 

(["0"-"7"])* 

入 进 制 字符 0 位 或 多 位 排列 

("U")? ("L")? 这 两 部 分 是 等 同 的 。 该 模式 下 两 者 都 省 略 的 话 为 “”( 空 字符 ) ;省 略 一 
者 的 话 为 “u” 或 “L”; 两 者 都 不 省 略 的 话 是 “UL”。 这 可 以 用 来 描述 表示 数值 类 型 的 结尾 词 


um o6 »(D 


U p? “FE 3 











译 者 注 





(D 器 表 示 无 符号 整数 ，L 表示 长 整数 ，UL 表示 无 符号 的 长 整数 。 





48 | 第 4 章 词法 分 析 


Y 扫描 不 生成 token 的 单词 











本 节 将 介绍 空白 符 和 注释 这 种 不 生成 token 的 字符 串 的 扫描 方法 。 


SKIP 命令 和 SPECIAL_TOKEN 命令 


上 上 一 节 中 介绍 的 都 是 生成 token 的 规则 ， 例 如 扫描 到 "void" 会 生成 VOID token. 

与 之 相对 ， 编 程 语言 的 代码 中 存在 本 身 不 具有 意义 的 部 分 ， 例 如 空白 符 和 注释 ， 这 一 部 分 
在 扫描 后 必须 跳 过 。 

要 跳 过 这 部 分 代码 ， 可 以 如 下 使 用 SKIP 命令 (SKIP directive )。 





























SKIP: { 
«token 名 : 模式 > 
| <token 名 : 模式 > 


| «token : 模式 > 


MEH TOKEN 命令 而 使 用 SKIP 命令 的 话 就 不 会 生成 token， 因 此 使 用 SKIP 命令 可 以 省 
略 token 名 。 

还 可 以 用 SPECIAL TOKEN 命令 (SPECIAL TOKEN directive ) 来 跳 过 tokens SKIP 命令 
和 SPECIAL TOKEN 命令 的 区 别 在 于 是 否 保 存 跳 过 的 tokens H SKIP 命令 无 法 访问 跳 过 的 字 
fjtB, fH] SPECIAL TOKEN 命令 就 可 以 借助 下 面 被 扫描 的 TOKEN 对 象 来 取得 跳 过 的 字符 串 。 
相应 的 方法 将 在 第 7 章 详细 说 明 。 


F3 跳 过 空白 符 
让 我 们 试 着 看 一 下 使 用 SKIP 命令 和 sPECIAL TOKEN 命令 的 例子 。 从 cbe 的 代码 中 提取 


出 跳 过 token 之 间 的 空白 符 的 规则 ， 如 代码 清单 4.3 所 示 。 
代码 清单 4.3” 跳 过 空白 符 ( parser/Parser.jj ) 


SPECIAL TOKEN: { «SPACES: ([" ", "Nt", "An", "Ay", "Mf£"])4s } 


























[" ", "Np", "Nn", "NU, "\£"] 表示 "on (5 空格 )、 "NEM ( 制 表 符 )、 "\n" ( 换行 
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符 )、"\r"( 回 车 )、"\f"( 换 页 符 ) 之 中 的 任意 一 个 ， 后 面 加 上 “+” 表 示 上 述 5 种 字符 之 一 
1 个 或 多 个 排列 而 成 的 字符 串 。 

因为 使 用 了 SPECIAL TOKEN 命令 ， 所 以 上 述 描述 表示 读 取 并 跳 过 由 空格 、 制 表 符 、 换 
行 、 回 车 、 换 页 符 之 中 的 任意 一 个 排列 组 成 的 字符 串 。 

另外 ， 因 为 使 用 了 SPECIAL_TOKEN 命令 而 非 SKIP 命令 ， 所 以 读 取 跳 过 的 部 分 可 以 通过 
下 面 要 扫描 的 Token 对 象 进行 访问 。 


FJ 跳 过 行 注释 
再 来 看 一 下 另 一 个 扫描 后 不 生成 token 的 例子 。 扫 描 行 注释 的 cbe 代码 如 代码 清单 44 所 示 。 


代码 清单 4.4” 跳 过 行 注 释 ( parser/Parser.jj ) 


SPECIAL TOKEN: { 
<LINE COMMENT: mA (^ ["Xn", "iy U])* ("Xn" | "Arn" | "Ay"U)?s 


) 






































这 里 又 用 到 了 新 的 模式 ， 同 样 让 我 们 按 顺 序 来 看 一 下 。 


n//n 

TA M” 

[* Va", "\r"] 

换行 ("\n" ) 或 回 车 ("\r") 

- ["\n", ren] 

换行 ("\n" ) A Nr") 以 外 的 字符 

(= ["\n", men] ) s 

AMT ("Nn") 或 回 车 ("\r" ) 以 外 的 字符 0 个 或 多 个 排列 

"Vn? | "zn | Ve 

各 种 平台 上 的 换行 符 

("\n" | za | V2 

换行 符 ， 可 省 略 

总 结 一 下 ， 上 述 代码 所 描述 的 模式 是 以 “/” 开 始 ， 接 着 是 换行 符 以 外 的 字符 ， 并 以 换行 符 
结尾 的 字符 串 。 简 单 来 说 ， 这 里 描述 的 是 从 “/ ”开始 到 换行 符 为 止 的 字符 串 。 文 件 的 最 后 可 
能 没有 换行 符 ， 因 此 换行 符 是 可 以 省 略 的 。 
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扫描 具有 结构 的 单词 








本 他 将 为 大 家 介绍 对 块 注 释 和 字符 串 字 面 量 这 样 有 起 始 符号 和 终结 符号 的 token 的 扫描 方法 。 


最 长 匹配 原则 和 它 的 问题 


让 我 们 试 着 思考 一 下 块 注释 ( /*..…..*/ ) 的 扫描 方法 。 这 个 例子 中 包含 了 几 个 比较 棘手 的 
问题 ， 让 我 们 按 顺 序 来 看 一 下 。 
首先 要 注意 的 是 下 列 模式 是 无 法 正确 地 扫描 块 注释 的 。 














SKIP ( «n *n (TTD Tw/ "> } 


如 果 这 样 写 ， 那么 直到 注释 的 终结 符 为 止 都 和 模式 “(~[] )*” 匹 配 ， 最 终 下 面 代码 中 底 纹 
较 深 的 部 分 都 会 被 作为 注释 扫描 。 














import stdio; 
Vs RE EUER a 
Tne 
main (Gnt arge, char **argv) 
{ 
printf("Hello, World! Wn"); 
return 0; /* 以 状态 0 结束 */ 





原因 在 于 “~ [] ”和 任意 一 个 字符 匹配 ， 所 以 和 “*”"”/ ”也 是 匹配 的 。 并 且 “*” 模 式 会 尽 可 
能 和 最 长 的 字符 串 进行 匹配 ， 因 此 结果 就 是 和 最 后 (第 2 处 ) 出 现 的 “*/” 之 前 的 部 分 都 匹配 了 。 

这 里 的 “ 尽 可 能 和 最 长 的 字符 串 匹 配 ” 的 方针 称 为 最 长 匹配 原则 (longest match principle )。 
扫描 块 注释 的 情况 下 最 长 匹配 原则 表现 得 并 不 理想 ， 但 一 般 情况 下 最 长 匹配 原则 并 不 是 太 粳 糕 。 
也 有 一 些 其 他 的 正则 表达 式 的 实现 方式 ,但 首先 我 们 还 是 默认 使 用 能 够 正确 运行 的 最 长 匹配 。 


[Py 基于 状态 迁移 的 扫描 
为 了 解决 模式 “(~ [] ) *” 在 块 注释 的 情况 下 过 度 匹 配 的 问题 ， 需 要 进行 如 下 修改 。 






































SKIP: ( «"/*"» : IN BLOCK COMMENT j 
«IN BLOCK COMMENT» SKIP: { <~[]> } 
«IN BLOCK COMMENT» SKIP: ( «"*/"» : DEFAULT j 
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上 述 例子 中 的 IN BLOCK COMMENT 是 扫描 的 状态 (state )。 通 过 使 用 状态 ， 可 以 实现 只 扫 
描 代 码 的 一 部 分 。 
让 我 们 来 讲解 一 下 状态 的 使 用 方法 。 首 先 再 看 一 下 上 述 例子 中 的 第 1 行 。 


























SKIP: ( «"/*"» : IN BLOCK COMMENT } 


这 样 在 规则 定义 中 写 下 { 模式: 状态 名 } 的 话 ， 就 表示 匹配 模式 后 会 迁移 (transit) 到 对 应 
的 状态 。 上 述 例子 中 会 迁移 到 名 为 IN_BLOCK_COMMENT 的 状态 。 

扫描 器 在 迁移 到 某 个 状态 后 只 会 运行 该 状态 专用 的 词法 分 析 规 则 。 也 就 是 说 ， 在 上 述 例 子 
中 ,除了 IN BLOCK COMMENT 状态 专用 的 规则 之 外 ， 其 他 的 规则 将 变 得 无 效 。 

要 定义 某 状态 下 专用 的 规则 ， 可 以 如 下 这 样 在 TOKEN 等 命令 前 加 上 < 状态 名 >。 


< 状态 名 > TOKEN: (-) 
«Ave» sKIP: (-) 
< 状态 名 > SPECIAL TOKEN: (-) 


再 来 看 一 下 扫描 块 注释 的 例子 中 的 第 2 行 和 第 3 行 。 























«IN BLOCK COMMENT» SKIP: ( <~[]> } 
«IN BLOCK COMMENT» SKIP: ( «"*/"» : DEFAULT ) 


只 有 当 扫 描 器 处 于 IN BLOCK COMMENT 状态 下 时 ， 这 两 个 规则 才 有 效 ， 而 其 他 规则 在 这 
个 状态 下 将 变 得 无 效 。 


最 后 再 看 一 下 示例 代码 的 第 3 行 。 








«IN BLOCK _ COMMENT> SKIP: ( «"*/"» : DEFAULT } 

该 行 中 的 <"*/">:DEERAULT 也 表示 状态 迁移 ， 意 思 是 匹配 模式 "*/" 的 话 就 迁移 到 
DEFAULT 状态 。 

DEFAULT 状态 (DEFAULT state ) 表示 扫描 需 在 开始 词法 分 析 时 的 状态 。 没 有 特别 指定 状 
态 的 词法 分 析 规 则 都 会 被 视 作 DEFAULT 状态 。 也 就 是 说 ， 至 今 为 止 所 定义 的 保留 字 的 扫描 规 
则 、 标 识 符 的 规则 以 及 行 注释 的 规则 实际 上 都 属于 DEFAULT 状态 。 

<"*/">:DEFAULT 的 意思 是 匹配 模式 "*/" 的 话 就 回 到 最 初 的 状态 。 


F3 MORE 命令 
至 此 ， 扫 描 块 注释 的 代码 如 下 所 示 。 
































SKIP: [ «"/*"» : IN BLOCK COMMENT ] 
«IN BLOCK COMMENT» SKIP: ( <~[]> } 
«IN BLOCK COMMENT» SKIP: { «"*/"» : DEFAULT } 


但 实际 上 上 述 代码 仍然 存在 问题 ， 上 述 代 码 在 扫描 过 程 中 到 达 文 件 的 尾部 时 会 出 现 很 糟糕 
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例如 ， 对 下 面 这 样 〈 存 在 语法 错误 ) 的 Cb 代码 进行 词法 分 析 。 


int 
main(int argc, char **argv) 


{ 


return 0; 
o 

上 述 代 码 应 该 是 忘记 关闭 块 注 秋 了。 如果 对 上 述 程序 进行 处 理 ， 理 想 的 情况 是 提示 “注释 
未 关闭 ”这 样 的 错误 ， 但 如 果 使 用 刚才 的 词法 分 析 规 则 ， 则 不 会 提示 错误 而 是 正常 结束 。 

未 提示 错误 的 原因 在 于 使 用 了 3 个 SKIP 命令 的 规则 进行 扫描 。 像 这 样 分 成 3 个 规则 来 使 
H SKIP 命令 的 话 ，3 个 规则 就 会 分 别 被 视 为 对 各 自 的 token 的 描述 ， 因 此 匹配 到 任何 一 个 规则 
都 会 认为 扫描 正常 结束 。 所 以 即使 块 注释 中 途 结束 ， 上 述 规 则 也 无 法 检测 出 来 。 实 际 是 用 3 个 
规则 对 一 个 注释 进行 词法 分 析 ， 所 以 要 将 “这 3 个 规则 用 于 解析 一 个 注释 ”这 样 的 信息 传 给 扫 
Tide o 

这 时 就 可 以 使 用 MORE 命令 ( MORE directive )。 通 过 使 用 MORE 命令 ， 可 以 将 一 个 token 
分 割 为 由 多 个 词法 分 析 的 规则 来 描述 。 

首先 ， 使 用 MORE 命令 改进 后 的 块 注 释 的 词法 分 析 规 则 如 下 所 示 。 






































MORE: ( «"/*"» : IN BLOCK COMMENT } 
«IN BLOCK COMMENT» MORE: { <~[]> } 
«IN BLOCK COMMENT» SKIP: { «"*/"» : DEFAULT } 


第 1 行 和 第 2 行 的 SKIP 命令 被 蔡 换 为 了 MORE 命令 ， 这 样 就 能 向 扫描 器 传达 “ 仅 匹 配 该 
规则 的 话 扫描 还 没有 结束 "。 换 言 之 ， 如 果 使 用 MORE 命令 扫描 后 遇 到 文件 未 尾 ， 或 无 法 和 之 后 
的 规则 匹配 ， 就 会 发 生 错 误 。 

因此 只 要 使 用 MORE 命令， 在 块 注释 的 中 途 遇 到 文件 结尾 时 就 可 以 正确 提示 错误 了 。 


FJ 跳 过 块 注释 

关于 跳 过 块 注 释 我 们 已 经 讨论 了 很 多 ， 这 里 再 来 总 结 一 下 。 我 们 从 cbe 的 代码 中 提取 出 扫 
描 块 注释 的 部 分 ， 如 代码 清单 4.5 所 示 。 
代码 清单 4.5” 跳 过 块 注释 ( parser/Parser jj ) 


MORE: { <"/*"> : IN BLOCK COMMENT } 
«IN BLOCK COMMENT» MORE: { <~[]> ) 
«IN BLOCK COMMENT» SPECIAL TOKEN: { «BLOCK COMMENT: "*/"» : DEFAULT } 


























我 们 主要 解决 了 两 大 问题 。 
首先 ， 使 用 (~ [] ) * 这 样 一 个 模式 一 口气 扫描 注释 的 话 ， 就 会 越过 注释 的 终结 符 而 引发 过 
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度 匹 配 问题 ， 因 此 我 们 引入 了 状态 迁移 对 其 进行 改善 。 

其 次 ， 只 使 用 SKIP 命令 或 SPECIAL TOKEN 命令 进行 扫描 的 话 ， 在 注释 的 中 途 遇 到 文件 
结尾 时 就 无 法 正确 提示 错误 。 因 此 除 最 后 的 规则 之 外 我 们 全 部 使 用 MORE 命令 ， 以 便 能 够 明示 
扫描 器 正在 扫描 一 个 tokens 

解决 了 上 述 两 个 问题 ， 就 能 够 正确 扫描 块 注释 ， 也 能 够 很 好 地 处 理 错误 了 o 

虽然 看 起 来 有 些 复杂 ， 但 所 有 具有 起 始 符 和 终结 符 的 单词 都 可 以 用 类 似 的 方法 进行 扫描 。 
此 后 还 将 介绍 类 似 的 例子 ， 所 以 请 掌握 状态 迁移 和 MORE 命令 的 用 法 。 


[3 扫描 字符 串 字 面 量 

让 我 们 再 来 看 一 个 使 用 MORE 命令 的 例子 。 提 取出 字符 串 字面 量 ( "Hello" 等 ) 的 扫描 规 
则 ， 如 代码 清单 4.6 所 示 。 字 符 串 字面 量 同样 具有 起 始 符 和 终结 符 ， 所 以 也 使 用 了 状态 迁移 和 
MORE 命令 。 


代码 清单 4.6 ”扫描 字符 串 字 面 量 ( parser/Parser.jj ) 









































MORE: { <"\""> : IN STRING } // 规则 1 
<IN STRING> MORE: { 
二 // 规则 2 
| <"\\" (["0"-"7"]){3}> // 规则 3 
| «NW - D» // 规则 4 
} 
«IN STRING» TOKEN: ( «STRING: "\""> : DEFAULT } // 规则 5 








首先 ， 借 助 状态 迁移 可 以 用 多 个 规则 来 描述 token。 扫 描 到 规则 1 的 起 始 符 “"” 后 迁移 到 
IN STRING 状态 ， 只 有 规则 2、3 、4 在 该 状态 下 是 有 效 的 。 

其 次 ， 除 了 最 后 的 规则 5 之 外 ,规则 1 ~ 4 都 使 用 MORE 命令 将 用 多 个 规则 扫描 一 个 token 
这 样 的 信息 传达 给 了 JavaCC。 这 样 一 来 ,在 token 扫描 到 一 半 而 中 途 结束 时 就 能 够 给 出 正确 的 


错误 提示 。 


F3 扫描 字符 字面 量 
最 后 来 看 一 下 扫描 字符 字面 量 ('A' 等 ) 的 代码 。 字 符 字 面 量 的 规则 如 代码 清单 4.7 所 示 。 
代码 清单 4.7 扫描 字符 字面 量 ( parser/Parser.jj ) 





























MORE: { <"'"> : IN CHARACTER } // 规则 1 
<IN CHARACTER> MORE: { 

<~ [NNT "\n", "\r"]> : CHARACTER TERM // 规则 2 

| ao : CHARACTER TERM // 规则 3 

| "NN lls : CHARACTER TERM // 规则 4 








} 


«CHARACTER TERM» TOKEN: { «CHARACTER: "'"> : DEFAULT ) // 规则 5 
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从 代码 上 看 和 字符 串 字面 量 的 分 析 规 则 非常 相似 ， 但 也 有 一 些 不 同 之 处 。 相 同 之 处 在 于 扫 
描 到 规则 1 的 起 始 符 “'” 之 后 迁移 到 IN_CHARACTER 状态 ， 但 之 后 若 扫描 到 一 个 字符 或 转 义 
字符 (escape sequence )， 则 要 迁移 到 CHARACTER TERM 状态 。 

至 此 我 们 所 看 过 的 块 注释 或 字符 串 字 面 量 中 ， 从 起 始 符 到 终结 符 之 间 的 长 度 是 任意 的 ， 但 
字符 字面 量 的 内 容 不 允许 超过 一 个 字符 的 字面 量 ， 因 此 扫描 到 一 个 字符 的 内 容 后 能 接受 的 就 只 





有 终结 符 “'” 了 。 这 里 迁移 到 CHARACTER TERM 状态 即 表 示 “ 下 一 个 符号 只 接受 终结 符 ”。 
» 
ha 扫描 块 注释 的 正则 表达 式 























本 节 我 们 组 合 使 用 了 多 个 规则 来 扫描 块 注释 ， 事 实 上 只 用 一 个 规则 也 能 够 描述 块 注释 ， 该 规则 
可 以 写成 如 下 形式 。 








SKIP : { < of dem (Ex puse bye (Osee («["/", Miei (~["*"])* ("*")4)* um > } 

















但 这 样 的 写法 存在 3 个 问题 。 

首先 ， 过 于 复杂 、 难 以 理解 。 从 静心 凝神 开始 分 析 ， 你 可 能 要 花费 整整 一 小 时 才 会 发 出 “ 啊 |! 

原来 可 以 这 样 扫描 啊 ! ”的 感慨 ， 完 全 领会 可 能 需要 3 个 小 时 左右 。 

其 次 ， 容 易 让 人 觉得 自己 来 思考 这 样 复杂 的 模式 太 难 了 。 

最 后 ， 注 释 的 终结 符 缺 失 时 ， 上 述 模式 将 无 法 识别 “扫描 注释 途中 遇 到 文件 结尾 ”这 样 的 错 

误 。 注 释 途 中 文件 结束 的 情况 下 ， 像 上 面 这 样 用 一 个 规则 描述 模式 的 话 ， 仅 能 识别 出 “文件 最 后 存 

在 无 法 扫描 的 字符 串 ” 这 样 的 错误 。 
使 用 状态 迁移 的 方法 最 初 可 能 看 起 来 有 些 复 杂 ， 稍 微 习 惯 后 就 能 够 很 方便 地 使 用 。 像 块 注释 和 

字符 串 这 样 具 有 起 始 符 和 终结 符 的 token， 请 使 用 状态 迁移 进行 扫描 。 




























































































































































































































































基于 JavaCC 的 解析 器 
的 描述 
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ETE ac conr neus 








本 节 我 们 将 一 边 制 作 Cb 语言 的 解析 右 ， 一 边 对 使 用 JavaCC 制作 解析 器 的 方法 进行 介绍 。 


本 章 的 目的 


首先 ， 让 我 们 来 回顾 一 下 解析 需 的 作用 。 
编译 器 中 解析 器 的 作用 是 利用 扫描 器 生成 的 token 序列 来 生成 语法 树 。 例 如 ， 生 成 如 图 5.1 
所 示 的 语法 树 。 














语句 


表达 式 


函数 调用 


RAA UU 实 参 列表 小 


printf "Hello, World!" 
图 5.1 语法 树 的 例子 
如 图 5.1 HR, FEBA "(r r)" 等 对 应 代码 中 的 工 个 单词 。 换 言 之 ， 就 是 能 够 作为 扫 
描 融 中 的 1 个 token 被 识别 。 
另 一 方面 ,“ 语 句 ” 和 “函数 调用 ” 则 对 应 多 个 单词 ， 即 对 应 多 个 token。 但 这 样 的 语法 扫 
描 需 是 无 法 识别 的 。 
将 上 述 这 样 由 多 个 token 构成 的 语法 单位 识别 出 来 ， 正 是 解析 器 最 重要 的 工作 。 在 token 序 
列 中 ， 只 要 知道 了 “这 个 单词 列 是 语句 ”“ 这 是 函数 调用 ”等 ， 接 下 来 就 只 需 根据 token 信息 来 
构建 语法 树 即 可 ， 并 不 是 什么 太 难 的 工作 。 


基于 JavaCC 的 语法 描述 


下 面 就 来 讲 一 下 使 用 JavaCC 从 token 序列 中 识别 出 “语句 ”“ 表 达 式 ”“ 辆 数 调 用 ”等 语法 
单位 的 方法 。 
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只 要 为 JavaCC 描述 “语句 "“ 表 达 式 ” “函数 调用 ”这 样 的 语法 单位 各 自 是 由 怎样 的 token 
序列 构成 的 ， 就 能 够 对 该 语法 进行 分 析 (C parse ). 

例如 ， 让 我 们 以 最 简单 的 赋值 表达 式 为 例 来 思考 一 下 。 最 简单 的 赋值 表达 式 可 以 描述 为 
“符号 ”“"-"”“ 表 达 式 ”的 排列 。 换 言 之 ， 如 果 存 在 “符号 ”“" ="” “表达 式 ” 这 样 的 排列 ， 
那 就 是 赋值 表达 式 。 这 个 规则 在 JavaCC 中 表示 成 下 面 这 样 。 











assign(): 
{} 
{ 
<IDENTIFIERS "z" expr () 
} 
assign () 对 应 赋值 表达 式 ，< IDENTIFIER> 对 应 token 标识 符 ，"=" 对 应 "="token, 
































expr () 对 应 表达 式 。assign() 和 expr() 是 笔者 随便 取 的 名 字 ， 并 不 是 说 赋值 表达 式 就 必 
须 是 assgin(), ， 表 达 式 必须 是 expr () 。 

像 «IDENTIFIER» 这 样 已 经 在 扫描 屁 中 定义 过 的 token， 在 描述 解析 器 时 可 以 直接 使 用 。 
其 他 的 如 "=" 这样 的 固定 字符 串 因为 同样 可 以 表示 token， 所 以 也 能 在 规则 中 使 用 。 

另外 ， 表 达 式 expr () 自身 也 是 由 多 个 token 构成 的 。 这 样 的 情况 下 需要 进一步 对 expr () 
的 规则 进行 描述 。 夹 杂 着 中 文 来 写 的 话 大 致 如 下 所 示 。 

















expr(): 
0 
{ 
expr() "+" expr () 
或 expr() "-" expr() 


像 这 样 写 好 所 有 语法 单位 的 规则 之 后 ， 基 于 JavaCC 的 解析 需 的 描述 也 就 完成 了 。 大 家 应 
该 有 一 个 大 致 的 印象 了 吧 。 


[FSI 终端 符 和 非 终端 符 


这 里 请 记 住 1 个 术语 。JavaCC 中 将 刚才 的 “语句 ”“ 函 数 调用 ”“ 表 达 式 ”等 非 token 的 语 
法 单位 称 为 非 终端 符 (nonterminal symbol )， 并 将 非 终 端 符 像 Java 的 也 数 调用 一 样 在 后 面 加 上 
括号 写成 stmt () 或 expr() 。 
既然 有 “ 非 ” 终 端 符 ， 自 然 也 有 终端 符 。 终 端 符 (terminal symbol) 可 以 归纳 为 token。 使 
用 在 扫描 器 中 定义 的 名 称 ， 可 以 写成 «IDENTIFIER» 或 <LONG>。 并 且 JavaCC PRTA 
Titia P xe XC token Ah, "=", "ar, "==" 这 样 的 字符 串 字面 量 也 可 以 作为 终端 符 来 使 
用 (K 5.1). 


























58 | 第 5 章 基于 JavaCC 的 解析 器 的 描述 


表 5.1 终端 符 和 非 终端 符 

种 类 含义 例 

终端 符 token <IDENTIFER>、<LONG>、'="、"+' 
非 终端 符 终端 符 排列 组 成 的 语法 单位 stmt(. expr(. assignment( 

在 讲解 token 时 我 们 提 到 了 “token 是 单词 的 字面 表现 和 含义 的 组 合 "， 这 里 的 终端 符 和 非 终 
端 符 中 的 “ 符 ” 可 以 说 蕴含 了 相同 的 意思 。 

也 就 是 说 ， 这 里 的 “ 符 ” 也 兼 具 字面 表现 和 含义 两 重 功能 。 举 例 来 说 ， 赋 值 表达 式 这 样 的 
非 终端 符 就 既 有 i-1 这 样 的 字面 表现 ， 又 有 “将 整数 1 赋值 给 变量 i1” 这 样 的 含义 。 字 面 表现 
和 含义 两 者 的 组 合 才 能 称 为 “ 符 ”。 

顺便 提 一 下 ， 至 于 为 什么 称 为 终端 和 非 终 端 ， 是 因为 在 画 语法 树 的 图 时 ,终端 符 位 于 树 的 
枝 干 的 末端 (终端 )。 非 终端 符 由 于 是 由 其 他 符号 的 列 组 成 的 ， 因 此 一 定位 于 分 义 处 ， 而 非 树 的 







































































JavaCC 的 EBNF 表示 法 


下 面具 体 地 说 一 下 JavaCC 中 语法 规则 的 描述 方法 。 

JavaCC 使 用 名 为 EBNF (Extended Backus-Naur Form ) 的 表示 法 来 描述 语法 规则 。EBNF 
和 描述 扫描 器 时 使 用 的 正则 表达 式 有 些 相 似 ， 但 比 正 则 表达 式 所 能 描述 的 语法 范围 更 广 。 

首先 ， 表 52 中 罗列 了 JavaCC 的 解析 器 生成 器 所 使 用 的 EBNF 表示 法 。 
表 5.2 JavaCC 的 EBNF 表示 法 



































种 类 例子 

终端 符 «IDENTIFIER» 或 

非 终端 符 name() 

连接 <UNSIGNED><LONG> 

重复 0 次 或 多 次 (","expr())* 

重复 1 次 或 多 次 (stmt())+ 

选择 <CHAR>|<SHORT>|<INT>|<LONG> 
可 以 省 略 [<ELSE> stmt()] 














我 们 已 经 讲 过 了 终端 符 和 非 终端 符 ， 下 面 我 们 从 第 3 项 的 “连接 ”开始 来 看 一 下 。 




















例如 C 语言 (Cb) 的 continue 语句 是 保留 字 continue 和 分 号 的 排列 。 反 过 来 说 ， 如 
果 保 留 字 continue 之 后 接着 分 号 ， 就 说 明 这 是 cont inue 的 语句 。JavaCC 中 将 该 规则 写成 
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如 下 形式 。 
<CONTINUB> it 
«CONTINUE» 是 表示 保留 字 continue 的 终端 符 ，" ;" 是 表示 字符 自身 的 终端 符 。 像 这 


FÉ, JavaCC 中 通过 简单 地 并 列 符号 来 表示 连接 。 
表示 连接 的 符号 可 以 是 终端 符 也 可 以 是 非 终 端 符 ， 当 然 两 者 混用 也 是 可 以 的 。 


FJ 重复 0 次 或 多 次 

接着 我 们 来 看 一 下 如 何 描述 将 符号 重复 0 次 或 多 次 。 重 复 是 指 相同 的 符号 X 并 排出 现 多 次 
的 模式 。 

例如 ，C 语言 (Cb ) 的 代码 块 中 可 以 记载 0 个 或 多 个 语句 的 排列 ， 我 们 来 试 着 描述 一 下 。 
下 面 的 写法 就 能 表示 0 个 或 多 个 语句 (stmt : statement ) 排列 。 























(stmt () ) * 


和 正则 表达 式 相 同 ，* 是 表示 重复 0 次 或 多 次 的 特殊 字符 。 并 且 此 处 stmt () 两 侧 的 括号 
不 能 省 略 。 
再 来 看 一 个 例子 。 函 数 的 参数 是 由 逗号 分 隔 的 表达 式 (expr:expression ) 排列 而 成 的 。 换 
种 说 法 就 是 expr 之 后 排列 着 0 个 或 多 个 逗号 和 expr 的 组 合 。 这 样 的 规则 在 JavaCC 中 写成 如 
下 形式 。 





























exse) (UV eges) 


上 述 表 述 中 ，* 的 作用 域 是 与 其 紧 挨 着 的 左 侧 括号 中 的 内 容 ， 也 就 是 说 ， 作 用 对 象 是 逗号 
和 expr 这 两 者 。 因 此 上 述 规则 能 够 表现 下 面 这 样 的 符号 列 。 





() 
exp exp 
Sae 9," æg VY Ged) 
expr() " 


iU crees LOWE «pase 7 exqsse(ty 
在 编程 语言 的 语法 中 ,“ 期 间 O OO 重复 多 次 ”是 非常 常见 的 ， 因 此 请 将 刚才 的 写法 作为 常用 
的 语法 描述 记忆 下 来 。 


F3 重复 1 次 或 多 次 
刚才 我 们 看 了 重复 0 次 或 多 次 ，JavaCC 同样 可 以 表示 重复 1 次 或 多 次 。 和 正则 表达 式 一 
FE, 重复 1 次 或 多 次 也 使 用 + 写成 如 下 形式 。 
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(stmt () ) + 


上 上述 代 码 描述 了 非 终 端 符 stmt () 重复 1 次 或 多 次 。 如 果 stmt () 是 语句 的 话 ，(stmt () ) + 
就 是 1 个 或 多 个 语句 的 排列 。 


选择 
接着 是 符号 的 选择 (alternative )。 选 择 是 指 在 多 个 选项 中 选择 1 个 的 规则 ， 比 如 选择 符号 A 


或 者 符号 B。 
例如 Cb 的 类 型 有 void、char、unsigneqd char 等 ， 可 以 写成 如 下 形式 。 











«VOID» | «CHAR» | UNSIGNED = «CHAR» | --- 


即 zvOID» 2X «CHAR» 或 -UNSIGNED»«CHAR» 或 …… 的 意思 。 
F3 可 以 省 略 
某 些 模式 可 能 出 现 0 次 或 1 次 ， 即 可 以 省 略 。 表 示 这 样 的 模式 时 使 用 [] 。 


以 变量 的 定义 为 例 。 定 义 变量 时 可 以 设置 初始 值 ， 但 如 果 不 设 置 的 话 也 没有 问题 。 也 就 是 
说 ,初始 值 的 记载 是 可 以 省 略 的 。 这 样 的 情况 下 ， 在 JavaCC 中 可 以 写成 如 下 形式 。 




















storage() typeref() name() ["=" expr()] ";" 
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语法 的 二 义 性 和 token 的 超前 扫描 











本 节 将 介绍 使 用 JavaCC 进行 语法 分 析 时 所 遇 到 的 各 类 问题 ， 以 及 其 解决 方法 之 一 一 一 
token 的 超前 扫描 。 


语法 的 二 义 性 


事实 上 ，JavaCC 并 非 能 够 分 析 所 有 用 上 一 节 叙 述 的 方法 (EBNF ) 所 描述 的 语法 。 原 因 在 
于 用 EBNF 描述 的 语法 本 质 上 存在 具有 二 义 性 的 情况 。 

举 一 个 有 名 的 例子 ， 让 我 们 试 着 考虑 下 C 语言 中 if 语句 的 语法 。C 语言 中 的 if£ 语句 用 
JavaCC 的 EBNF 可 以 如 下 这 样 描述 。 














Hirt (ea sem eleet sy 
另 一 方面 ， 作 为 符合 上 述 规则 的 具体 代码 ， 我 们 来 看 一 下 下 面 的 例子 。 


if (cond1) 
if (cond2) 
iE (Oy e 
else 
g0; 


让 我 们 根据 刚才 的 规则 试 着 分 析 下 这 段 代 码 。 
乍 看 之 下 会 觉得 第 2 个 if 和 else 是 成 对 的 ， 这 一 整体 位 于 最 初 的 i£ 条 件 之 下 。 加 上 括 
号 后 的 代码 如 下 所 示 。 





if (cond1) ( 
if (cond2) ( 
i£ (0) g 
) else ( 
g0; 
) 
) 


但 实际 上 ， 如 果 不 依赖 直觉 ， 仪 依据 刚才 的 规则 仔细 思考 一 下 ， 下 面 这 样 的 解释 也 是 可 能 的 。 





if (cond1) ( 
ace icond2)m 
* (0) g 
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也 就 是 说 ， 对 于 1 份 具体 的 代码 ， 可 以 如 图 5.2 这 样 生 成 2 棵 语法 树 。 像 这 样 对 于 单个 输 
入 可 能 有 多 种 解释 时 ， 这 样 的 语法 就 可 以 说 存在 二 义 性 。 


5.2 ”对 应 两 种 解释 的 语法 树 
顺便 说 一 下 ，C 语言 中 的 if£ 语句 的 规则 存在 二 义 性 的 问题 是 比较 有 名 的 ， 俗 称 空 悬 else 
( dangling else )。 
F3 Javacc 的 局 限 性 


刚才 的 空 悬 else 问题 ， 其 语法 在 本 质 上 就 存在 二 义 性 。 除 此 之 外 ， 也 存在 因为 JavaCC 本 身 
的 局 限 性 而 无 法 正确 解析 程序 的 情况 。 例 如 像 下 面 这 样 描述 语法 时 就 会 发 生 这 种 问题 。 





























type(): {} 
| 
«SIGNED» «CHAR» // XN 1 
| «SIGNED» «SHORT- // Me Z 
| <SIGNED> <INT> Wz S 
| <SIGNED> <LONG> // 选项 4 


事实 上 ，JavaCC 在 遇 到 用 “| ”分 隔 的 选项 时 ， 在 仅 读 取 了 1 个 token 的 时 刻 就 会 对 选项 进 
行 判断 ， 确 切 的 动作 如 下 所 示 。 

1. 读 取 1 个 token 

2. 按照 书写 顺序 依次 查找 由 上 述 token 开头 的 选项 

3. 找到 的 话 就 选用 该 选项 

也 就 是 说 ,根据 上 述 规 则 ，JavaCC 在 读 取 了 <SIGNED>token 时 就 已 经 选择 了 <SIGNED> 
<CHAR>， 即 选项 1。 因 此 即便 写 了 选项 2 和 选项 3， 也 是 完全 没有 意义 的 。 这 个 问题 称 为 
JavaCC 的 选择 冲突 ( choice conflict )。 
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提取 左 侧 共 通 部 分 








值得 庆幸 的 是 ， 当 你 写 了 会 发 生 选 择 冲 突 的 规则 的 情况 下 ， 若 用 





JavaCC 处 理 该 语法 描述 文 


件 ， 就 会 给 出 如 下 警告 消息 。 因 此 如 果 是 无 法 分 析 的 语法 ， 马 上 就 能 知道 。 


$ javacc Parser.jj 

Java Compiler Compiler Version 4.0 (Parser Generator) 
(type "javacc" with no arguments for help) 

Reading from file Parser.jj . . . 

Warning: Choice conflict involving two expansions at 


line 642, column 8 and line 643, column 7 respectively. 


A common prefix is: "unsigned" 


Consider using a lookahead of 2 for earlier expansion. 


Parser generated with 0 errors and 1 warnings. 





像 这 样 ， 消 息 中 如 果 出 现 了 Choice conflict 字眼 ， 就 说 明 发 生 了 选择 冲突 。 
解决 上 述 问 题 的 方法 有 两 个 ， 其 中 之 一 就 是 将 选项 左 侧 共 通 的 部 分 提取 出 来 。 以 刚才 的 规 




















则 为 例 ， 修 改 为 如 下 这 样 即 可 。 


QE Ü 


«SIGNED» («CHAR» | «SHORT» | «INT» | «LONG-) 





这 样 就 不 会 发 生 选 择 冲突 了 。 

















当 遇 到 JavaCC 的 上 述 局 限 性 时 ， 应 首先 考虑 是 否 可 以 用 提取 共通 部 分 的 方法 来 处 理 。 但 还 











是 存在 使 用 此 方法 仍然 无 法 描述 的 规则 ， 以 及 提取 共通 部 分 的 处 理 
况 下 就 可 以 通过 接 下 来 要 讲 的 “token 的 超前 扫描 ”来 解决 。 


token 的 超前 扫描 
































E 常 复杂 的 情况 ， 这 样 的 情 








之 前 提 到 了 JavaCC 在 遇 到 选项 时 仅 根 据 读 取 的 1 个 token 来 判断 选择 哪个 选项 。 事 实 上 这 


只 是 因为 JavaCC 默认 仅 根 据 读 取 的 1 个 token 进行 判断 。 只 要 明确 


指定 ，JavaCC 可 以 在 读 取 


更 多 的 token 后 再 决定 选择 哪个 选项 。 这 个 功能 就 称 为 token 的 超前 扫描 (lookahead )。 
刚才 列举 的 语法 规则 也 能 够 用 token 的 超前 扫描 进行 分 析 ， 为 此 要 将 规则 写成 如 下 形式 。 


RE {} 
LOOKAHEAD (2) <SIGNED> <CHAR> Wl 
| LOOKAHEAD (2) <SIGNED> <SHORT> // XkIRn2 
| LOOKAHEAD(2) «SIGNED» «INT» // 选项 3 
| <SIGNED> <LONG> // XkIma4 
义 下 省 略 











(D 也 称 为 “向 前 读 取 ”。 译 者 注 
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添加 的 LOOKAHEAD (2) 是 关键 。LOOKAHEAD (2) 表示 的 意思 为 “ 读 取 2 个 token 后 ， 如 
果 读 取 的 token 和 该 选项 相符 合 ， 则 选择 该 选项 ”。 也 就 是 说 ,， 读 取 2 个 token， 如 果 它 们 是 
«SIGNED» 和 «CHAR» 的 话 ， 就 选用 选项 1。 同 样 ， 第 2 个 选项 的 意思 是 读 取 2 个 token， 如 果 
它们 是 <SIGNED> 和 <SHORT> 的 话 ， 就 选用 选项 2。 

需要 超前 扫描 的 token 个 数 ( 上述 例子 中 为 2 ) 是 通过 “共通 部 分 的 token 数 +1” 这 样 的 算 
式 计 算得 到 的 。 例 如 ， 上 述 规则 中 选项 之 间 的 共通 部 分 为 <SIGNED>， 只 有 1 个 ， 因 此 需要 超 
前 扫描 的 token 个 数 为 在 此 基础 上 再 加 1， 即 2。 

为 什么 这 样 能 够 解决 问题 呢 ? 因为 只 要 读 取 了 比 共通 部 分 的 token 数 多 1 个 的 token， 就 一 
定 能 读 到 非 共 通 部 分 的 token， 也 就 是 说 ， 能 够 读 到 各 选项 各 自 特有 的 部 分 。 经 过 了 这 样 的 确认 
后 再 进行 选择 就 不 会 有 问题 了 。 

最 后 的 选项 ( 选项 4 ) 不 需要 使 用 LOOKAHEAD。 这 是 因为 LOOKAHEAD 是 在 还 剩 下 多 个 选 
项 时 ， 为 了 延迟 决定 选择 哪个 选项 而 使 用 的 功能 。 

正如 之 前 所 讲 的 那样 ，JavaCC 会 优先 选用 先 描述 的 选项 ， 因 此 ， 当 到 达 最 后 的 选项 即 意味 
着 其 他 的 选项 都 已 经 被 丢 充 ， 只 剩 下 这 最 后 1 个 选项 了 。 在 只 剩 下 1 个 选项 时 ， 即 便 推 迟 选择 
也 是 没有 意义 的 。 如 果 和 任何 一 个 选项 都 不 匹配 的 话 ， 那 只 能 是 代码 存在 语法 错误 了 。 
最 后 ， 无 法 获知 “共通 部 分 的 token 数 ” 的 情况 也 是 存在 的 。 这 样 的 例子 以 及 解决 方案 将 
在 稍 后 介绍 “更 灵活 的 超前 扫描 ”这 一 部 分 时 进行 讨论 。 


可 以 省 略 的 规则 和 冲突 


除 “ 选 择 ” 以 外 ,选择 冲突 在 “可 以 省 略 ” 或 “重复 0 次 或 多 次 ”中 也 可 能 发 生 。 

可 以 省 上 略 的 规则 中 ， 会 发 生 “ 是 省 略 还 是 不 省 略 ” 的 冲突 ， 而 非 “选择 选项 1 还 是 选项 
2” 的 冲突 。 之 前 提 到 的 空 悬 else 就 是 一 个 具体 的 例子 。 空 悬 else 的 问题 在 于 内 侧 的 i£ 语句 的 
else 部 分 是 否 省 略 (图 5.3 )。 如 果 内 测 的 if 语句 的 else 部 分 没有 省 略 ， 则 else 部 分 属于 
内 侧 的 i£ 语句 ， 如 果 省 略 的 话 则 属于 外 侧 的 iE 语句 。 


内 侧 的 if 语句 不 省 略 else 的 情况 内 侧 的 if 386) 4386 else 的 情况 
































































































































if (cond1) 


if (cond2) f() if (cond2) f() 


else g() 





5.3 Z*& else 问题 和 冲突 


ZEE else 最 直观 的 判断 方法 是 “else 属于 最 内 侧 的 i£”， 因 此 试 着 使 用 LOOKAHEAD 来 进 
行 判断 。 首 先 ， 未 使 用 LOOKAHEAD 进行 判断 的 规则 描述 如 下 所 示 。 
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ES 
{ 
} 
使 用 LOOKAHEAD 来 避免 冲突 发 生 的 规则 如 下 所 示 。 


ainge (expe ES tS COO MM [ESTE S RE SMS tm te ON] 


ncm PEE 


Í 
} 


«IF» "(" expr() ")" stmt() [LOOKAEHAD(1) «ELSE» stmt()] 


如 你 所 见 ， 判 断 方 法 本 身 非常 简单 。 通 过 添加 LOOKAHEAD (1) ， 就 可 以 指定 “ 读 取 1 个 
token 后 ， 如 果 该 token 符合 规则 ( 即 如 果 是 <ELSE> ) 则 不 省 略 <ELSE> stmt ()”。 这 样 就 能 
明确 else 始终 属于 最 内 侧 的 i£ 语句 ， 空 悬 else 的 问题 就 可 以 解决 了 。 


重复 和 冲突 


重复 的 情况 下 会 发 生 “ 是 作为 重复 的 一 部 分 读 入 还 是 跳出 重复 ”这 样 的 选择 冲突 。 
来 看 一 个 具体 的 例子 ， 如 下 所 示 为 Cb 中 表示 函数 形 参 的 声明 规则 。 




























































































avum deris 
type (Um wea [Mom m.m 
这 个 规则 中 ， 表 示 可 变 长 参数 的 "，" " . . ." 不 会 被 解析 。 原 因 大 家 应 该 知道 的 吧 。 
根据 上 述 规则 ， 在 读 取 type O 后 又 读 到 "," 时 ， 本 来 可 能 是 "," type () 也 可 能 是 
的， 但 JavaCC 默认 向 前 只 读 取 1 个 token， 因 此 在 读 到 "," 时 就 必须 判断 是 继续 
重复 还 是 跳出 重复 。 并 且 恰 巧 "," 和 ("," type()) 的 开头 一 致 ， 所 以 JavaCC 会 一 直 判 断 为 
重复 ("," type())*， 而 规则 "," "..." 则 完全 不 会 被 用 到 。 实 际 上 如 果 程 序 中 出 现 "," 


"..."， 会 因为 不 符合 规则 "," type 0 而 判定 为 语法 错误 。 
要 解决 上 述 问题 ， 可 以 如 下 添加 LOOKAHEAD。 
param decls(): () 


type() (LOOKAHEAD(2) "," type())* ["," "..."] 











这 样 JavaCC 在 每 次 判断 该 重复 时 就 会 在 读 取 2 个 token 后 再 判断 是 否 继续 重复 ， 因 此 在 输 
入 了 "0.7 后 就 会 因为 检测 到 和 "," type () 不 匹配 而 跳出 ("," type() ) * 的 重复 。 
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F3 更 灵活 的 超前 扫描 

关于 token 的 超前 扫描 ，JavaCC 中 还 提供 了 更 为 灵活 的 方法 。 之 前 提 到 的 LOOKAHEAD 可 
以 指定 “恰好 读 取 了 几 个 token”， 除 此 之 外 还 可 以 指定 “ 读 取 符合 这 个 规则 的 所 有 token”。 

让 我 们 来 看 一 下 需要 用 到 上 述 功 能 的 例子 。 请 看 下 面 的 规则 。 








definition(): {} 

| storage() type() «IDENTIFIER» ";" 
| storage() type() «IDENTIFIER» arg decls() block() 
以 下 省 略 

上 述 是 Cb 的 参数 定义 和 函数 定义 的 规则 。 左 侧 的 部 分 完全 一 样 ， 也 就 是 说 ， 这 样 的 规则 也 
会 发 生 选 择 冲突 。 虽 说 可 以 通过 提取 左 侧 共 通 部 分 来 解决 问题 ,但 这 次 让 我 们 考虑 尝试 用 超前 
扫描 的 方法 。 

用 超前 扫描 来 分 析 上 述 规 则 ， 读 取 “ 恰 好 n 个 ”token 是 行 不 通 的 。 原 因 在 于 共通 部 分 
storage() type() «IDENTIFIER» 中 存在 非 终 端 符号 storage() 和 type () 。 因 为 不 知 
道 storage () 和 type() 实际 对 应 几 个 token， 所 以 无 法 用 读 取 “恰好 nm AP" token 来 处 理 。 

这 里 就 需要 使 用 刚才 提 到 的 “ 读 取 符合 这 个 规则 的 所 有 token” 这 样 的 设置 。 上 述 规则 中 选 
项 间 的 共通 部 分 是 storage () type() «IDENTIFIER» ， 因 此 只 要 读 取 了 共通 部 分 加 上 1 个 


















































token， 即 storage() type <IDENTIFIER>";"， 就 能 够 区 别 2 个 选项 了 。 将 规则 进行 如 
下 改写 。 
definition(): () 


{ 
LOOKAHEAD (storage () type() «IDENTIFIER» ";") 
storage() type() «IDENTIFIER» ";" 
| storage() type() «IDENTIFIER» arg decls() block() 
以 下 省 略 
如 上 所 示 ， 只 需 在 LOOKAHEAD 的 括号 中 写 上 需要 超前 扫描 的 规则 即 可 。 这 样 利用 超前 扫 
描 就 能 够 顺利 地 区 分 2 个 选项 了 。 


超前 扫描 的 相关 注意 事项 


这 里 讲 一 个 和 token 的 超前 扫描 相关 的 注意 事项 。 

即便 写 了 LOOKAHEAD 也 并 非 一 定 能 按照 预期 对 程序 进行 分 析 。 添 加 LOOKAHEAD 后 
Choice conflict 的 警告 消息 的 确 消失 了 ， 但 实际 上 JavaCC 不 会 对 LOOKAHEAD 描述 的 
内 容 进行 任何 检查 。 在 发 生 选 择 冲 突 的 地 方 加 上 LOOKAHEAD 后 不 再 显示 警告 ， 仅 此 而 已 。 
LOOKAHEAD 处 理 的 描述 是 否 正确 ， 我 们 必须 自己 思考 。 
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CO 
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二 新 的 解析 器 构建 手法 









































几 年 前 ， 说 起 解析 器 人 们 首先 还 是 会 想起 yacc (LALR )， 但 最 近 解 析 器 界 出 现 了 新 的 流派 。 
其 中 之 一 是 和 LL 解析 器 、LR 解析 器 风格 截然 不 同 的 Packrat 解析 器 。 无 论 哪 款 Packrat 解析 
器 ， 都 具有 如 下 特征 。 


1. 支持 无 限 的 超前 扫描 

2. 无 需 区 分 扫描 器 和 解析 器 ， 可 以 一 并 编写 
3. 内 存 的 消耗 量 和 字符 串 的 长 度 ( 代码 的 长 度 ) 成 比例 
4. 语法 无 二 义 性 ( 不 会 发 生 空 悬 else 的 问题 


Packrat 解析 器 可 以 说 是 今后 的 潜力 股 。 
其 二 是 出 现 了 直接 使 用 编程 语言 来 描述 语法 的 方法 。 例 如 parser combinator 技术 就 是 其 中 之 一 。 
JavaCC 用 不 同 于 Java 的 形式 来 描述 语法 ， 之 后 再 生成 代码 。 如 果 使 用 parser combinator 这 
样 的 技术 的 话 ， 就 可 以 用 Java 等 编程 语言 直接 表示 语法 。 利 用 这 样 的 手法 ， 解 析 器 生成 器 就 成 为 
了 单纯 的 程序 库 ， 因 此 无 需 导 入 像 JavaCC 这 样 的 额外 的 ， 这 是 它 的 主要 优点 。 
无 论 上 述 哪 种 变化 ， 都 是 以 能 够 更 简单 、 方 便 地 使 用 解析 器 为 共同 目标 。 因 此 ， 在 用 Java 来 
作 解 析 器 时 ， 不 必 拘 泥 于 JavaCC， 不 妨 尝 试 一 下 这 些 新 的 方法 。 
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语法 分 析 





本 章 将 一 边 介 绍 Cb 编译 器 的 解析 器 ， 一 边 从 实 
践 的 角度 来 说 明基 于 JavaCC 的 解析 器 的 描述 
方法 。 
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本 节 我 们 将 一 边 实际 描述 Cb 的 语法 ， 一 边 具 体 地 看 一 下 基于 JavaCC 的 解析 器 的 描述 方法 。 


F 表示 程序 整体 的 符号 

语法 中 一 定 会 有 表示 “需要 解析 的 对 象 整体 ”的 符号 。 在 Cb 中 ， 编 译 的 单位 ， 即 “单个 的 
文件 ”是 需要 分 析 的 对 象 ， 所 以 需要 用 相应 的 语法 规则 对 其 进行 表示 。cbc 中 表示 1 个 文件 整体 
的 非 终 端 符号 被 称 为 compilation _ unit， 它 的 规则 如 代码 清单 6.1 所 示 。 
代码 清单 6.1 compilation_unit 的 规则 ( parser/Parser.jj ) 





compilation unit(): {} 


{ 


import_stmts() top_defs() <EOF> 


) 


Cb 的 文件 的 开头 是 数 个 import 声明 (import_stmts )， 之 后 排列 的 是 函数 或 类 型 定义 
(top_defs )。 上 述 规则 表现 的 就 是 这 样 的 排列 方式 。 

<EOF> 是 表示 文件 末尾 (End of File, EOF ) 的 终端 符号 。 在 像 compilation unit () 
这 种 表示 需要 分 析 的 对 象 整体 的 符号 最 后 ， 要 写 上 <EOF>。 

刚才 提 到 的 “函数 或 类 型 定义 的 排列 "， 其 实 恰恰 是 非常 重要 之 处 。Cb 的 程序 就 是 定义 的 
集合 。 例 如 Perl 或 Ruby 这 样 的 语言 可 以 不 定义 函数 或 方法 而 直接 编写 可 执行 的 语句 ， 因 此 程 
序 就 表现 为 语句 的 集合 。 相 反 ， 像 C、Java、Cb 这 样 以 编译 为 前 提 的 语言 ， 一 般 其 程序 表现 为 
函数 或 类 的 定义 的 集合 。 


[Py 语法 的 单位 

既然 已 经 出 现 了 “定义 ”“ 语 句 ” 这 样 的 用 语 ， 下 面 就 让 我 们 来 说 一 下 编程 语言 中 经 常用 到 
的 语法 单位 。 

一 般 编程 语言 的 语法 单位 有 下 面 这 些 。 


@ 定义 ( definition ) 


e 声明 ( declaration ) 
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è 语句 ( statement ) 

@ 表达 式 ( expression ) 

e Jj (term) 

“定义 ”是 指 变量 定义 、 函 数 定 义 或 类 定义 等 。 以 C 语言 为 例 ， 就 有 变量 的 定义 、 函 数 的 定 
义 以 及 类 型 的 定义 (准确 地 说 是 声明 )。 

函数 或 方法 的 定义 的 本 体 中 包含 有 “语句 ”。 例 如 C 语言 的 函数 定义 的 本 体 中 存在 if 语 
^]. while 话 句 和 for 语句 的 排列 。 

“表达 式 ” 是 比 语句 小 、 具 有 值 的 语法 单位 。 具 有 值 ， 是 指 将 表达 式 写 在 赋值 的 右 侧 ， 或 者 
在 函数 调用 时 写 在 参数 的 位 置 等 。C 语言 中 的 加 法 运算 (x+y)、 减 法 运算 (x-y) 以 及 函数 调用 都 
属于 表达 式 。 另 一 方面 ，iE、while 和 for 是 语句 ， 所 以 不 具有 值 。 比 方 说 不 存在 “if 语句 
整体 的 值 ”或 “while 语句 整体 的 值 ”这 样 的 说 法 ，if 语句 也 不 能 写 在 赋值 语句 的 右 侧 。 

最 后 ， 可 能 大 家 不 太 熟 悉 ， 在 编程 语言 的 语法 中 ,“ 项 ”这 一 语法 单位 也 经 常 被 使 用 。 项 是 
表达 式 中 构成 二 元 运算 的 一 方 ， 也 就 是 仅 由 一 元 运算 符 构 成 的 语法 。 例 如 ，x+y 中 的 x 就 是 项 。 
“+”“ 一 ”将 2 个 项 组 合 起 来 ， 因 此 称 为 二 元 运算 符 。 

定义 包含 语句 ， 语 句 包 含 表达 式 ， 表 达 式 包含 项 。 请 记 住 这 样 的 层次 结构 。 

接着 我 们 以 自 上 而 下 的 方式 从 定义 开始 看 一 下 各 个 规则 。 
























































import 声明 的 语 ; 


我 们 先 来 看 一 下 import 声明 的 规则 。import 声明 的 列表 所 对 应 的 符号 是 Import | 
stmts， 单 个 import 声明 就 是 import stmt, import 的 规则 如 代码 清单 6.2 所 示 。 








代码 清单 6.2 import 声明 的 列表 ( parser/Parser.jj ) 


import stmts(): () 


{ 
} 


(import stmt())* 


代码 清单 6.3 import 声明 ( parser/Parser jjj ) 


import stmt(): {} 


{ 
} 


«IMPORT» name() ("." name())* ";" 


import stmts Æ 0 3*4 import stmt 的 列表 ，import_stmt 由 保留 字 import, 
name () 0 个 或 多 个 点 (".") fll name () 的 列表 ,以 及 最 后 的 分 号 (";") 排列 而 成 。 非 终端 符 
号 name 之 后 还 会 经 常 出 现 ， 所 以 我 们 也 一 起 来 看 一 下 。 
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代码 清单 6.4 name 的 规则 ( parser/Parser.jj ) 


name(): {} 


{ 
} 


<IDENTIFIER> 


如 上 所 示 ， 非 终端 符号 name 和 <IDENTIFIER> 是 相同 的 。 既 然 这 样 ， 那 么 特地 使 用 名 为 
name 的 非 终端 符号 好 像 没 有 意义 。 别 急 ， 到 之 后 构建 语法 树 的 阶段 你 就 会 明白 为 什么 这 么 做 了 。 

我 们 回 到 import_stmt。 既 然 name 和 <IDENTIFIER> 相同 ,那么 import stmt 的 规 
则 和 下 面 的 写法 是 等 价 的 。 








«IMPORT» «IDENTIFIER» ("." «IDENTIFIER»)* ";" 


具体 来 说 ， 就 是 像 下 面 这 样 的 排列 。 





import stdio; 
import sys.types; 


大 家 理解 了 吗 ? 
FJ 各 类 定义 的 语法 

让 我 们 回 到 主题 ， 来 看 一 下 定义 的 语法 。 表 示 定 义 列表 的 符号 是 top defs. top defs 
的 规则 如 代码 清单 6.5 所 示 。 


代码 清单 6.5 top_defs 的 规则 ( parser/Parser.jj ) 
top defs(): {} 


{ 








( LOOKAHEAD (storage () typeref() «IDENTIFIER» "(") 
defun () 

| LOOKAHEAD (3) 
defvars () 

defconst () 

defstruct () 

defunion () 


| 
| 
| 
| typedef () 
)* 





似乎 一 下 子 变 得 复杂 了 ， 不 用 怕 ， 我 们 先 把 LOOKAHEAD 去 掉 来 看 一 下 。 


defun() 
defvars() 
defconst() 
defstruct () 
defunion() 
typedef () 
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可 以 看 出 top_defs 是 由 0 个 或 多 个 aefun (图 数 定义 ，define function) xX de£vars 
( 变量 定义 ，define variable ) 或 de£const (常量 定义 ，define constant ) 或 de£struct (结构 
体 定 义 ，define struct) 或 de£union (联合 体 定 义 ，define union) 或 typedef 组 成 的 。 简 而 言 
之 ， 就 是 在 文件 的 最 高 层 上 ， 排 列 着 0 个 或 多 个 定义 。 

理解 规则 的 含义 后 ， 我 们 再 来 试 着 看 一 下 LOOKAHEAD。 第 1 个 LOOKAHEAD 是 描述 
defun() 的 ， 如 下 所 示 。 

















LOOKAHEAD(storage() typeref() «IDENTIFIER» "(") 
defun() 





这 里 的 LOOKAHEAD 主要 是 为 了 区 分 defun ( 函数 定义 ) 和 de£vars (FEE ) PÉZIGE 
义 和 变 量 定 义 直 到 形 参 列表 的 括号 出 现 为 止 是 无 法 区 分 的 ， 因 此 对 这 一 共通 部 分 实施 超前 扫描 。 

第 2 个 LOOKAHEAD (3) 也 一 样 ， 是 为 了 区 分 defvars、defconst fll de£struct, 
defunion 而 加 上 的 。defvars 和 defconst 的 开头 出 现 了 变量 类 型 ， 这 样 的 类 型 中 也 包括 
结构 体 和 联合 体 。 因 此 只 读 取 1 个 token 是 无 法 和 结构 体 或 联合 体 的 定义 进行 区 分 的 。 

以 具体 的 例子 来 说 明 。 例 如 ， 定 义 struct point 类 型 的 变量 p 的 代码 如 下 所 示 。 






































struct point p; 
男 一 方面 ，struct point 结构 体 的 定义 如 下 例 所 示 。 


struct point [ 
int x; 
int y, 


上 述 情况 下 ， 在 扫描 开始 的 2 个 token (struct fl point) 的 阶段 ， 是 无 法 区 别 要 定义 的 
是 struct point 类 型 的 变量 还 是 struct point 类 型 自身 的 。 只 有 在 扫描 了 3 个 token HT, 
即 看 到 struct point p 或 struct point (Hj, 才能 够 区 分 这 两 者 。LOOKAHEAD (3) 中 
的 “3” 就 是 上 述 内 容 的 体现 。 


F3 变量 定义 的 语 ; 
接着 我 们 来 看 一 下 变量 定义 的 规则 。 表 示 变 量 定义 的 符号 是 defvars。 变 量 定义 支持 一 次 
定义 多 个 变量 ， 所 以 用 了 复数 形式 defvars。defvars 的 规则 如 代码 清单 6.6 所 示 。 


代码 清单 6.6 defvars 的 规则 ( parser/Parser.jj ) 


defvars(): () 


( 


























storage() type() name() ["-" expr()] 
("n," name() ["z" expr()1)* UE 
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storage(): {} 


Í 
} 


[«STATIC»] 























B5, storage () 是 可 以 省 略 的 static。 之 后 是 type () (变量 类 型 ) 和 name () (7E 
量 名 )。 我 们 已 经 知道 name () 在 语法 上 和 «IDENTIFIER» 是 等 价 的 。 

最 后 是 可 以 省 略 的 初始 化 表达 式 ["=" expr () ] 。C 语言 中 可 以 通过 var = (1,2,3]" 
这 样 的 写法 来 初始 化 数组 或 结构 体 ， 但 Cb 中 不 支持 这 样 的 写法 ,初始 化 时 可 用 的 仅 限于 一 般 的 


FJ 国 数 定义 的 语 ; 
下 面 让 我 们 试 着 看 一 下 函数 定义 的 语法 。 表 示 函 数 定义 的 符号 是 defun, defun 的 规则 如 
代码 清单 6.7 所 示 。 


代码 清单 6.7 defun 的 规则 ( parser/Parser.jj ) 


defun(): {} 


{ 
} 
storage () 和 刚才 一 样 是 可 以 省 略 的 static。 紧 接着 的 typeref () 在 语法 层面 上 和 
type O 是 相同 的 。 后 面 跟着 的 是 表示 消 数 名 的 name () 、 用 括号 围 起 来 的 params 0. OES 
声明 )， 以 及 block ()( 函数 本 体 )。 
再 看 一 下 params () 和 block() 的 规则 。 先 从 params () 看 起 (代码 清单 6.8 )。 
代码 清单 6.8 params 的 规则 ( parser/Parser.jj ) 














storage() typeref() name() "(" params() ")" block() 





























params(): {} 
{ 
LOOKAHEAD(«VOID» ")") «VOID» // 选项 1 
| fixedparams() ["," "..."] // 选项 2 


Cb 的 params () ( 形 参 声 明 ) 有 如 下 3 种 。 


1. 无 参数 ( 形 参 声明 为 void。 如 getc 等 ) 

2. 定 长 参数 ( 参数 的 个 数 是 固定 的 。 如 puts 或 fgets 等 

3. 可 变 长 参数 ( 参数 的 个 数 不 确 定 。 如 printf 等 ) 

params () 规则 的 第 1 个 选项 表示 无 参数 的 情况 。 使 用 LOOKAHEAD 是 为 了 排除 返回 值 为 
void 类 型 的 子 数 指针 等 。 
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params () 规则 的 第 2 个 选项 是 定 长 参数 或 可 变 长 参数 ， 所 表示 的 语法 为 :fixedparams () 
是 定 长 参数 的 声明 ， 可 变 长 参数 的 情况 下 后 面 再 加 上 "，," "..."。 

顺便 说 一 下 ，C 和 Cb 都 必须 有 1 个 或 1 个 以 上 的 形 参 后 才 支 持 可 变 长 参数 。 也 就 是 说 ， 
£(...) 这 样 的 声明 是 不 允许 的 。 必 须要 有 最 少 1 个 的 固定 参数 ， 例 如 E (int x，...)。 这 么 
做 的 原因 在 于 C 语言 (Cb ) 是 通过 可 变 长 参数 的 前 一 个 参数 的 地 址 来 取得 剩余 参数 的 。 

接着 来 看 一 下 fixedparams () 的 规则 。 请 看 代码 清单 6.9。 
代码 清单 6.9 fixedparams 的 规则 ( parser/Parser.jj ) 














fixedparams(): {} 
{ 
param() (LOOKAHEAD(2) "," param())* 
} 
param(): {} 


{ 
} 


type() name() 

















fixedparams() 是 用 "," 分割 的 多 个 param()。param() H type () (类 型 ) 和 
name() ( 形 参 名 ) 排列 而 成 。 加 上 LOOKAHEAD (2) 是 为 了 让 解析 器 注意 到 当 输 入 为 "," 
"的 时 候 ,，"..." 和 params() 不 匹配 ， 这 样 就 能 够 顺利 地 跳出 重复 。 换 言 之 ， 就 是 为 
了 避免 把 输入 "," nili 解析 为 规则 "," param() 。 

最 后 我 们 来 看 一 下 函数 定义 的 本 体 block () 的 规则 (C 代码 清单 6.10 )。 
代码 清单 6.10 block 的 规则 ( parser/Parser.jj ) 


block(): {} 


{ 
} 














"{" defvar list() stmts() "}" 


block () 由 占 位 符 ("{" 和 "}") 围 着 ,以 defvar list O (临时 变量 定义 列表 ) F 
始 ， 接 着 是 语句 列表 ( stmts () )。 


F3 结构 体 定义 和 联合 体 定 义 的 语 ; 
结构 体 和 联合 体 的 话 法 比较 类 似 ， 所 以 我 们 一 起 来 看 一 下 。 结 构 体 定义 的 语法 规则 
defstruct () 和 联合 体 定义 的 语法 规则 aefunion () 如 代码 清单 6.11 所 示 。 


代码 清单 6.11 defstruct 的 规则 ( parser/Parser.jj ) 


defstruct(): {} 


{ 
} 








«STRUCT» name() member list() ";" 
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defunion(): () 


Í 
} 


<UNION> name () member list() ";" 


结构 体 、 联 合体 的 定义 中 ， 首 先是 «STRUCT» 或 -UNION> (保留 字 struct 或 union )， 
接着 是 name () (类 型 名 )， 之 后 是 成 员 列表 。 

C 语言 中 在 定义 结构 体 的 同时 可 以 定义 该 类 型 的 变量 ，Cb 中 两 者 则 必须 分 开 定义 。 如 果 能 
在 定义 结构 体 的 同时 定义 变量 ， 那 么 就 可 以 一 边 定 义 结构 体 一 边 编写 返回 该 结构 体 的 函数 或 生 
成 该 结构 体 的 数组 ， 解 析 器 会 因此 变 得 格外 复杂 。 

类 型 和 变量 的 声明 能 够 一 并 进行 这 一 点 也 是 C 语言 的 类 型 声明 中 非常 讨厌 之 处 。 不 仅 对 解 
析 器 来 说 难以 解析 ， 而 且 笔 者 认为 这 还 是 大 量 产 生 人 们 难以 阅读 的 代码 的 温床 。 


F 结构 体 成 员 和 联合 体 成 员 的 语法 


让 我 们 回 到 结构 体 定 义 的 规则 。 表 示 结 构 体 或 联合 体 成 员 的 member 1ist 的 规则 如 代码 
清单 6.12 所 示 。 
代码 清单 6.12 member list 的 规则 ( parser/Parser.jj ) 
























































member list(): {} 
{ 
"(" (slot() ";")* ")" 
} 
slotO0: {} 


Í 
} 


type() name () 





member _list() 是 由 占 位 符 ("{" HI") 围 起 来 的 slot O 和 ";" WIJK, slot 
H type () (类 型 名 ) 和 name () (成 员 名 ) 排列 而 成 。 

member_1ist () 可 能 有 些 抽象 ， 让 我 们 一 边 看 代码 清单 6.13 ， 一 边 试 着 找 一 下 它 和 符号 
的 对 应 关系 。 
代码 清单 6.13 ”结构 体 定义 的 实例 


struct point { 
int x; 
int y; 





C 语言 中 对 于 1 个 类 型 可 以 用 逗号 分 隔 定 义 多 个 成 员 ，Cb 中 不 支持 这 样 的 写法 。 
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FJ typedef 语句 的 语 ; 
最 后 讲 一 下 typedef 语句 的 定义 。 表 示 typedef 语句 的 符号 是 typedef， 其 规则 如 代 
码 清单 6.14 所 示 。 


代码 清单 6.14 typedef 的 规则 ( parser/Parser.jj ) 


typedef (): {} 


{ 
} 























<TYPEDEF> typeref() «IDENTIFIER» ";" 


jx AA bu] ct FE] A INE. d <TYPEDEF> (保留 字 typedef)、typeref 
( 本 来 的 类 型 )、 标 识 符 «IDENTIFIER» (新 的 类 型 名 ) 以 及 ";" 排列 而 成 。 


类 型 的 语法 

至 此 我 们 已 经 多 次 用 到 了 type 和 typeref 这 样 的 符号 。 在 本 节 结 束 前 ， 让 我 们 来 看 一 下 
它 的 规则 。 

请 注意 这 里 所 说 的 “类 型 ”并 不 是 指 类 型 的 定义 。 严 格 来 说 ， 我 们 接 下 来 看 到 的 规则 表示 
的 是 “类 型 的 名 字 ”。cbc 中 将 类 型 的 名 字 称 为 类 型 引用 (typeref，type reference )。 刚 才 所 讲 的 
结构 体 和 联合 体 的 定义 中 不 包含 typedef。 

type 及 其 相关 规则 如 代码 清单 6.15 所 示 。 
代码 清单 6.15 type 的 规则 ( parser/Parser.jj ) 


typeO : {} 
{ 


) 






































typeref () 


typeref(): {} 


typeref base() 


( LOOKAHEAD(2) "[" "]" // 不 定 长 数组 
| "[" «INTEGER» "]" // 定 长 数组 

| den // 指针 

| "(" param typerefs() ")" // 函数 指针 

) 





type () 的 语法 和 typedef () 完全 一 样 。 仪 从 语法 上 看 会 觉得 type O 规则 重复 定义 了 ， 
但 在 生成 语法 树 的 时 候 就 能 够 看 出 type () 规则 存在 的 意义 。 

typedef () 的 规则 是 在 typeref base (0 后 添加 任意 数量 的 数组 [] 或 指针 * 等 符号 。 
param typerefs () 只 是 将 之 前 提 到 的 函数 的 形 参 的 规则 (params 0 ) 中 的 变量 名 去 除 ， 这 








里 就 不 进行 讲解 了 。 
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C 语言 和 Cb 在 变量 定义 上 的 区 别 











事实 上 ， 变 量 定义 的 语法 是 C 语言 和 Cb 差异 最 显著 之 处 。 这 也 是 笔者 有 意 进行 修改 的 。 
C 语言 中 定义 int 类 型 的 数组 x 时 的 代码 如 下 所 示 。 


sitate [ell 


而 Cb 中 采用 的 则 是 Java 的 风格 。 


aut (LSI eg 


通过 这 样 的 语法 修改 ，Cb 中 能 够 只 使 用 


1 个 符号 type () (或 typeref () ) 来 表示 类 型 。 


并 且 数 组 、 指 针 、 函 数 指针 都 采用 统一 的 后 置 记 法 ， 也 就 无 需 一 一 考虑 “ 先 和 指针 结合 还 是 先 
和 数组 结合 ”等 问题 了 。 因 此 ,“ 指 向 “函数 指针 的 数组 的 数组 ”的 指针 ”这 种 类 型 的 变量 在 





Cb 中 就 能 够 简单 地 写成 如 下 形式 ， 读 的 时 候 


sme cra s EU EX TRTIR TIS 





也 只 需 按照 从 左 到 右 的 顺序 即 可 。 


例如 下 面 这 行 代码 在 C 语言 和 Cb 中 的 含义 就 不 一 样 。 


siae, VS. Wh 








C 语言 中 这 样 的 定义 表示 六 是 int 类 
示 x 和 y 都 是 int 类 型 。 也 就 是 说 ， 为 了 明 


























型 ， 而 y 是 int 类型。 在 Ch 中 ,这 样 的 定义 则 表 








确 意图 ，Cb 中 应 该 像 下 面 这样 用 空格 进行 分 割 。 





intx x, y;  // 为 了 强调 意图 而 改变 空格 数量 














众所周知 ，C 语言 的 变量 定义 非常 难以 理解 。 在 这 点 上 ， 像 Cb 这 样 将 类 型 和 变量 名 明确 分 


开 的 做 法 更 易于 理解 一 些 。 


基本 类 型 的 语 ; 











接着 让 我 们 来 看 一 下 刚才 出 现 过 的 typeref base 的 规则 。 该 符号 表示 除数 组 、 指 针 以 外 


的 基本 类 型 。 其 规则 如 代码 清单 6.16 所 示 。 


代码 清单 6.16 typeref base 的 规则 ( parser/Parser.jj ) 


typeref base(): {} 
{ 
<VOID> 
| <CHAR> 
| <SHORT> 
| <INT> 
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<LONG> 

LOOKAHEAD (2) <UNSIGNED> <CHAR> 

LOOKAHEAD (2) <UNSIGNED> <SHORT> 

LOOKAHEAD (2) <UNSIGNED> <INT> 

<UNSIGNED> <LONG> 

<STRUCT> <IDENTIFIER> 

<UNION> <IDENTIFIER> 

LOOKAHEAD ( { isType (getToken(1).image)]) <IDENTIFIER> 











首先 uns igned char 和 unsigned short 等 规则 的 开头 部 分 一 致 因此 这 些 规则 都 必 
须 添加 LOOKAHEAD 来 解决 选择 冲突 。 

在 最 后 的 规则 中 出 现 了 未 曾 见 过 的 LOOKAHEAD 的 用 法 。 这 里 的 LOOKAHEAD 执行 由 “位 
和 “}” 括 起 来 的 Java 代码 ， 如 果 返 回 true 则 视 作 超前 扫描 成 功 。 也 就 是 说 ， 在 上 述 情况 下 ， 
如 果 isType (getToken (1) .image) 返回 true， 就 选择 最 后 的 选项 。 

getToken 是 JavaCC 提供 的 方法 ， 根 据 指定 的 参数 返回 前 项 的 token， 即 getToken (1) 
会 返回 前 项 的 第 1 个 token。 

isType 是 cbc 自行 定义 的 函数 ， 如 果 传 人 的 参数 是 typedeEf 中 定义 过 的 类 型 名 则 返回 
true。 也 就 是 说 ， 这 个 LOOKAHEAD 只 有 在 下 一 个 读 入 的 <IDENTIFIER> 是 typedef "PiE 
义 过 的 类 型 名 时 才 会 成 功 。 

之 所 以 需要 这 个 LOOKAHERAD， 是 因为 如 果 人 允许 任意 的 «IDENTIFIER» (标识 符 ) 作为 类 
型 名 ， 会 发生 比较 严重 的 冲突 。 例 如 ， 请 试 着 思考 一 下 下 面 这 样 的 语法 。 






































return (ne) (Go 


这 样 的 语句 怎么 看 都 是 将 x + y 转换 成 int 型 后 返回 。 但 下 面 这 样 的 语句 又 是 怎么 样 的 呢 ? 











return (t) (x + y); 


在 上 述 情 况 下 ， 如 果 t 为 类 型 名 ， 那 么 和 刚才 一 样 ,将 x + y 转换 为 t 类 型 后 返回 。 但 如 
R t 并 非 类 型 名 ， 则 有 可 能 是 利用 冰 数 指针 的 函数 调用 (t 是 被 赋值 为 函数 指针 的 变量 )。 

如 果 人 允许 所 有 的 «IDENTIFIER» 都 作为 类 型 名 ， 那 么 上 述 表 达 式 就 无 法 被 解析 为 函数 调用 
To 为 了 防止 这 样 的 事情 发 生 ， 所 以 要 使 用 LOOKAHEAD 进行 限制 : HJE typedef 中 定义 过 
的 名 称 识别 为 类 型 名 。 
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本 市 我 们 将 设计 表现 语句 的 规则 。 


P 语句 的 语法 
在 函数 定义 的 规则 中 第 一 次 出 现 了 表示 语句 列表 的 符号 stmt s。 本 节 我 们 就 从 stmts Jf 
始 依次 来 看 一 下 。stmts 及 其 相关 的 规则 如 代码 清单 6.17 所 示 。 


代码 清单 6.17  stmts 的 规则 ( parser/Parser.jj ) 


stmts(): {} 


{ 





(stmt () ) * 


stmt: {} 


(n; 
LOOKAHEAD(2) labeled stmt() 
expr() ";" 
block() 

if stmt() 

while stmt() 
dowhile stmt() 
for stmt () 
switch stmt () 
break stmt() 
continue stmt() 
goto stmt() 
return stmt () 





stmts () 是 0 个 或 多 个 stmt () 的 排列 ， 而 stmt () 是 上 述 13 个 选项 中 的 1 个 。 

第 1 个 选项 n; 表示 空 语句 。 

FE labeled_stmt () 表示 带 有 goto 标签 (例如 on_error: ) 的 语句 。labeleqd_ 
stmt () 开头 的 goto 标签 为 标识 符 ( <IDENTIFIER> )， 和 函数 调用 或 赋值 的 规则 是 共通 的 。 
因此 这 里 使 用 LOOKAHEAD (2) ， 通 过 读 入 «IDENTIFIER» 和 ":" 来 和 其 他 选项 进行 区 分 。 

下 一 个 选项 表示 在 expr ()( 表达 式 ) 后 面 加 上 " ;" 的 也 属于 语句 。 例 如 函数 的 调用 属于 











Pam) 
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KIKA, (HLH printf 的 调用 等 组 成 的 语句 也 是 存在 的 。 该 选项 对 应 的 就 是 这 种 情况 。 

block() 是 由 "{" 和 "}" 围 起 来 的 语句 列表 ， 即 表示 多 个 语句 。 

关于 从 if_stmt () 到 return_stmt () 这 部 分 ， 从 名 字 上 就 能 看 出 ，if_stmt () 是 if 
语句 ，while stmt() 是 while 语 句 ，dowhile stmt () 是 do-while 语句 。 

下 面 我 们 来 看 一 下 各 个 语句 的 规则 。 因 为 种 类 较 多 ， 这 里 不 对 所 有 的 规则 进行 讲解 ， 仅 选 
取 具 有 代表 性 的 i£ 语句 、while 语句 、for HAF break 等 比较 简单 的 语句 来 看 一 下 。 


F3 if 语 句 的 语 ; 
让 我 们 先 来 看 一 下 if 语句 。 表 示 if 语句 的 符号 if stmt 0 的 规则 如 代码 清单 6.18 所 示 。 


代码 清单 6.18 if stmt 的 规则 ( parser/Parser.jj ) 


if stmt: {} 


{ 
} 








«IF» "(" expr() ")" stmt() [LOOKAHEAD(1) «ELSE» stmt()] 


if 语句 由 保留 字 if 、 用 括号 围 起 来 的 表达 式 Cexpr O )、 语 句 (stmt O ) 排列 而 成 。 之 
后 跟着 的 是 可 以 省 略 的 else 部分。 如 第 5 RPR, HT BEZE else 的 问题 ， 这 里 需要 
LOOKAHEAD ( 工 ) 。 


省 略 if 语句 和 大 括号 


看 了 if 语句 的 规则 ， 你 可 能 会 觉得 奇怪 。 因 为 乍 看 之 下 会 觉得 这 样 的 规则 无 法 解析 像 下 面 
这 样 带 有 大 括号 的 语句 。 























// 条 件 为 真 的 情况 





// 条 件 为 假 的 情况 











但 事实 并 非 如 此 ， 用 刚才 的 规则 可 以 解析 上 述 语句 。 原 因 在 于 stmt 中 包含 了 程序 块 
(block )。 上 述 语句 能 够 如 图 6.1 这 样 进行 解析 。 
if (cond) (....) else (....) 
ES block block 
expr oc oc 
tmt tmt 
if stmt 


图 6.1 A block 的 if 语 名 的 解释 
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也 就 是 说 , 在 C 语言 中 ， 并 非 if 语句 的 then 部 分 和 else 部 分 可 以 用 大 括号 围 起 来 ,也 
可 以 省 略 大 括号 ， 而 是 if 语句 的 then 部 分 和 else 部 分 中 只 写 1 个 语句 ， 该 语句 自身 有 可 能 
是 用 大 括号 围 起 来 的 。 多 数 C 语言 人 门 书籍 中 都 将 大 括号 作为 i£ 语句 的 一 部 分 ， 因 此 这 样 的 
解析 方法 让 人 觉得 难以 接受 , 但 这 就 是 C 语言 真正 的 规范 。 while WAM for 语句 的 大 括号 
也 是 同样 道理 。 
随便 提 一 下 ，Cb 中 和 C 语言 一 样 可 以 省 略 大 括号 。 但 如 果 如 下 这 样 修改 if_stmt， 大 括 
号 就 不 可 省 略 了 。 
































de mawe a Ah 
{ 


«ipe "IU egaa "ym mae eeel) "DU eee "UT esemes) "pug 


) 


上 述 修改 能 带 来 意料 之 外 的 好 处 ， 那 就 是 不 会 发 生 空 悬 else 的 问题 。 只 要 总 是 为 i£ 语句 
加 上 大 括号 ， 就 能 够 清楚 地 知道 哪个 else 属于 哪个 i1£。 如 有 果 你 想 确认 一 下 的 话 ， 可 以 按照 上 
面 这 样 修改 cbe 的 代码 (不 使 用 LOOKAHEAD )， 并 试 着 用 JavaCC 进行 处 理 。 应 该 不 会 出 现 冲 突 


c p. 


但 是 ， 笔 者 并 不 认为 C 语言 的 大 括号 就 应 该 是 不 可 以 省 略 的 ， 因 此 这 里 让 Cb 和 C 语言 一 
样 可 以 省 略 大 括号 。 


F while 语句 的 语 ; 


接着 让 我 们 一 起 来 看 一 下 while 语句 的 语法 。 表 示 while 语句 的 符号 是 while_ 
stmt(). while stmt () 的 规则 如 代码 清单 6.19 所 示 。 
代码 清单 6.19 while stmt 的 规则 ( parser/Parser.jj ) 


while stmt(): {} 


{ 


<WHILE> "(" expr() ")" stmt() 


) 


























while stmt () 由 保留 字 while, FRERIKS (expr), WAJ (stmt ) 排列 而 
成 。 这 个 规则 应 该 没什么 问题 吧 。 


for 语句 的 语 ; 


最 后 看 一 下 for 语句 的 语法 。 表 示 for 语句 的 符号 是 for_stmt ()。for_stmt () 的 规 
则 如 代码 清单 6.20 所 示 。 
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代码 清单 6.20 for stmt 的 规则 ( parser/Parser.jj ) 


for stmt(): () 


{ 
} 


«FOR» "(" [expr()] ";" [expr()] ";" [expr()] ")" Stmt() 




















for stmt() 由 保留 字 for 开头 ， 之 后 是 3 个 用 括号 括 起 来 的 可 以 省 略 的 表达 式 
( expr () )， 表 达 式 之 间 用 " ; " 分 割 ， 最 后 是 for 语句 的 本 体 (stmt () )。 


各 类 跳 转 语句 的 语 ; 


最 后 让 我 们 来 看 几 个 跳 转 语句 的 规则 。 表 示 break 语句 的 break_stmt () 和 表示 
return 语句 的 return_stmt () 的 规则 如 代码 清单 6.21 所 示 。 
代码 清单 6.21 ” 跳 转 语句 的 规则 ( parser/Parser.jj ) 


break stmt(): {} 


( 

















«BREAK» ";" 
) 
return stmt(): {} 
{ 
LOOKAHEAD(2) «RETURN» ";" // 函数 没有 返回 值 的 情况 
| <RETURN> expr() ";" // 函数 有 返回 值 的 情况 

















break stmt () 很 简单 ， 只 有 保留 字 break 和 ";"。 

男 一 方面 ，return_stmt () 分 为 函数 有 返回 值 和 没有 返回 值 两 种 情况 ， 因 此 有 两 个 选项 。 
第 一 个 选项 是 没有 返回 值 的 情况 下 的 规则 ， 第 二 个 是 有 返回 值 的 情况 下 的 规则 。 另 外 ， 此 时 两 
个 选项 之 间 的 «RETURN» 是 共通 的 ， 为 了 能 够 正确 解析 ， 这 里 需要 LOOKAHEAD (2) o 
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表达 式 的 分 析 








本 节 中 我 们 来 设计 表现 表达 式 〈expr O ) 的 规则 。 


表达 式 的 整体 结构 


在 看 表达 式 的 语法 之 前 ， 我 们 先 来 说 一 下 表达 式 的 整体 结构 。 

我 们 之 前 看 过 的 定义 或 语句 的 语法 都 是 对 等 的 。 例 如 i£ 语句 和 while 语句 都 属于 语句 
(stmt () ) 的 一 种 ， 两 者 以 相同 的 规则 并 列 出 现 。 

但 表达 式 的 各 部 分 并 不 对 等 ， 更 确切 地 说 ， 表 达 式 的 结构 是 有 层次 的 。 原 因 在 于 表达 式 中 
所 使 用 的 运算 符 存 在 优先 级 (precedence )。 

















例如 二 元 运算 符 + 和 * 之 间 * 的 优先 级 高 ， 所 以 1+2*3 的 运算 顺 
序 是 1+ (2*3) ，4*2-3 的 运算 顺序 是 (4*2) -3。 以 语法 树 来 说 ，+ 总 
是 在 上 层 (靠近 根 节点 )， 而 * 则 位 于 下 层 (图 6.2 )。 ! 

一 般 来 说 ， 越 是 离 语法 树 的 根 节点 近 的 符号 ， 甚 解析 规则 越 是 先 出 





2 3 
图 6.2 表达 式 的 语法 树 














现 。 这 里 的 “ 先 ” 是 指 ， 从 compilation unit O 跟踪 调查 规则 时 ， 
会 较 早 地 出 现在 跟踪 到 的 规则 中 。 

换言之 ， 就 是 可 以 从 优先 级 低 的 运算 符 的 规则 开始 ， 按 照 自 上 而 下 的 顺序 来 描述 表达 式 的 
规则 。 


expr 的 规则 


表示 表达 式 的 符号 是 expr () expr O 的 规则 如 代码 清单 6.22 所 示 。 
代码 清单 6.22 expr() 的 规则 ( parser/Parser.jj ) 











expr(O0: {} 


LOOKAHEAD(term() "z") 
term() "=" expr() 

| LOOKAHEAD(term() opassign op()) 
term() opassign op() expr() 

| exprio() 
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这 个 规则 比较 难以 理解 ， 我 们 姑且 如 下 所 示 把 LOOKAHEAD 去 掉 。 


term() "=" rhs expr() // 选项 1 
| term() opassign op() expr() // 选项 2 
| expr10() // 选项 3 











此 时 ， 选 项 1 是 普通 的 赋值 表达 式 ， 选 项 2 表示 的 是 自我 赋值 的 表达 式 ， 选 项 3 的 
expr10() 是 比 赋值 表达 式 优先 级 更 高 的 表达 式 。 像 这 样 在 expr 后 添加 数字 的 符号 有 
expr1l () 到 expr10 ()。 数 字 越 小 ， 所 对 应 的 表达 式 的 优先 级 越 高 。 

term() 是 表示 不 包括 二 元 运算 符 在 内 的 单位 “项 ”的 非 终端 符号 。 在 C 语言 中 ， 赋 值 的 
左边 可 以 用 指针 表示 非常 复杂 的 表达 式 ， 因 此 一 般 “项 ”可 以 位 于 赋值 的 左边 。 

opassign op() 表示 像 “+=”“*=” 这 样 的 将 二 元 运算 符 和 赋值 运算 符 组 合 起 来 的 运算 
符 (复合 赋值 运算 符 )。 

看 一 下 之 前 的 选项 ， 可 见 选 项 1 和 选项 2 左 端 的 term() 是 共通 的 。 另 外 ， 如 果 看 一 下 
expr10(0 的 内 容 ， 就 可 以 发 现 其 左 端 也 有 term()， 所 以 这 3 个 选项 左 端 的 term() 都 是 共 
通 的 。 为 了 能 够 正确 解析 ， 要 在 选项 1 和 选项 2 之 前 都 加 上 LOOKAHEAD。3 个 选项 共通 的 部 分 
只 有 term() ， 所 以 LOOKAHEAD 要 在 term() 的 基础 上 再 多 读 入 1 个 token。 

下 面 我 们 来 看 一 下 opassign_op () 的 规则 。opassign _op() 的 规则 就 是 复合 赋值 运算 
符 的 集合 ( 代码 清 单 6.23 )。 
代码 清单 6.23 opassign_op 的 规则 ( parser/Parser.jj ) 












































opassign op(): {} 
{ 
( " 


$ 


eN *ı 


> 





想必 这 个 规则 没有 任何 难以 理解 之 处 。 


[F3 条 件 表达 式 
接着 来 看 一 下 exprio O 的 规则 。 这 是 条 件 运算 符 (三 元 运算 符 ) 的 规则 (代码 清单 6.24 )。 
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代码 清单 6.24 expr10 的 规则 ( parser/Parser.jj ) 


expr100: {} 


{ 


expr9() ["?" expr() ":" expr10()] 


) 


非 终端 符号 exprN 中 的 “N” 部 分 是 与 优先 级 对 应 的 ， 数 值 越 小 优先 级 越 高 。 上 述 规则 的 
优先 级 为 10， 所 以 属于 较 低 的 优先 级 。 

条 件 表达 式 中 有 3 个 表达 式 ， 各 个 表达 式 分 别 用 哪个 expr 是 这 里 的 难点 。 原 则 上 来 说 
“只 要 是 该 处 允许 的 语法 所 对 应 的 符号 就 可 以 ”"， 但 至 少 对 于 最 左 侧 的 expr 有 着 特别 的 限制 ， 
那 就 是 “不 允许 expr10 自身 或 开头 和 expr10 相 匹 配 的 符号 ”。 

JavaCC 会 将 1 个 规则 转化 为 1 个 方法 ， 即 如 果 像 上 面 这 样 定 义 了 符号 exprio 的 规则 ， 就 
会 生成 exprio 方法 ， 并 且 会 根据 规则 生成 方法 的 处 理 内 容 。 如 果 在 规则 中 写 有 非 终 端 符 号 ， 
就 会 直接 调用 符号 所 对 应 的 方法 。 也 就 是 说 ， 像 上 面 这 样 写 有 expr9 () 的 话 ， 就 会 在 该 处 调 
用 expr9 方法 。 如 果 写 的 是 终端 符号 ， 则 直接 转化 为 token。 

那么 如 果 在 expr10 的 定义 中 又 出 现 了 exprio 的 话 会 怎么 样 呢 ? 这 样 就 相当 于 在 方法 
expr10 中 又 调用 了 exprio 上 自身， 会 陷 和 人 无 限 的 递归 之 中 。 所 以 在 expr10 规则 的 左 侧 不 能 
出 现 exprio 自身 或 者 以 expr10 开头 的 符号 。 


A 二 元 运算 符 
下 面 我 们 来 了 解 一 下 二 元 运算 符 的 规则 。C 语言 和 Cb 语言 中 的 二 元 运算 符 以 及 对 应 的 优先 


级 如 表 6.1 所 示 ， 请 边 看 表 边 阅读 下 面 的 内 容 。 


表 6.1 二 元 运算 符 的 优先 级 
优先 级 运算 符 



























































>>、<< 

















一 | 已 | 上 | 上 IOI9DI、IIO | 





事实 上 用 JavaCC 来 解析 不 同 优先 级 的 二 元 运算 符 时 有 着 常规 的 写法 。Cb 的 二 元 运算 符 的 
规则 如 代码 清单 6.25 所 示 ， 很 明显 规则 是 具有 一 定 模式 的 。 
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代码 清单 6.25 ”二 元 运算 符 的 规则 ( parser/Parser.jj ) 


expr9(): {} 
{ 
expr8() ("||" expr8())* 
} 
expr8(): {} 
{ 
expr7() ("&&" expr7())* 
) 
expr7(): {} 
{ 
expr6() ( ">"  expr6() 
| "<" expr6() 
| ">=" expr6() 
| "<=" expr6() 
| iat expr6 () 
| "mil" expr6() )* 
) 
expr6(): {} 
{ 
expr5() ("|" expr5())* 
} 
expr5(): {} 
{ 
expr4() ("^" expr4())* 
} 
expr4(): {} 
{ 
expr3() ("&" expr3())* 
) 
expr30: {} 
{ 
expr2() ( ">>" expr2() 
| "<<" expr2() 
)* 
) 
expr20: {} 
{ 
exprl() ( "+" expr1() 
| "o" expr1 () 
)* 
) 
expr10: {} 
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每 个 规则 都 是 exprN(O (运算 符 exprN O)* 这 样 的 形式 ， 并 且 在 exprN 的 规则 中 只 用 
到 了 规则 exprN-1。 

为 了 理解 为 什么 这 样 的 规则 能 够 顺利 地 解析 表达 式 ， 首 先 我 们 只 用 + 和 * 来 思考 一 下 。 现 
在 假设 回 解 析 融 输入 了 如 下 这 样 的 表达 式 。 


2 


一 般 来 说 ， 如 果 基 于 解析 需 的 构成 来 说 明 解释 方法 的 话 ， 那 就 是 “因为 * 比 + 的 优先 级 高 ， 
所 以 先进 行 运算 ……”。 本 书 则 反 过 来 思考 ， 即 试 着 考虑 “因为 + 比 * 的 优先 级 低 ， 所 以 先进 
行 分 割 ……”。“ 优 先 级 低 ” 等 同 于 “分 割 表 达 式 的 能 力 强 ”"， 这 里 试 着 写 一 下 用 + 分 割 刚才 的 表 
达 式 。 





























(g c 3) * (4) * (5 = €) E (n Es E) 


于 是 用 + 分 割 的 各 表达 式 就 成 了 使 用 * 的 表达 式 或 单纯 的 数值 ， 即 成 了 expri()o PERSE 
quo 

即便 运算 符 继续 增加 ， 上 述 法 则 也 一 样 适用 。 这 是 因为 以 一 定 优先 级 的 运算 符 对 表达 式 进 
行 分 割 ， 分割 后 的 各 表达 式 中 仅 包 含 优先 级 更 高 的 运算 符 。 用 优先 级 6 的 运算 符 分 割 表达 式 ， 
则 分 割 后 的 各 表达 式 由 expr5 () 组 成 。 用 优先 级 4 的 运算 符 分 割 表 达 式 ， 则 分 割 后 的 各 表达 
XH expr3 () 组 成 。 

WRH EBNF 来 描述 上 述 法 则 ， 就 是 我 们 刚才 见 到 的 二 元 运算 符 的 规则 。 
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本 节 我 们 将 设计 表现 项 (term) 的 规则 。 


项 的 规则 


表示 项 的 符号 是 term。term 的 规则 如 代码 清单 6.26 所 示 。 
代码 清单 6.26 term 的 规则 ( parser/Parser.jj ) 


term: {} 


( 








LOOKAHEAD("(" type()) "(" type() ")" term() 
| unary () 





可 以 看 出 ，term() 可 以 是 带 有 cast( 类 型 转换 ) 运算 符 的 term()，, 或 者 unary ()。 


前 置 运算 符 的 规则 


接着 我 们 来 看 一 下 unary 的 规则 。unary 是 表示 种 有 前 置 运 算 符 的 项 的 符号 。unary 的 
规则 如 代码 清单 6.27 所 示 。 
代码 清单 6.27 unary 的 规则 ( parser/Parser.jj ) 









































unary(): () 
{ 
"^4" unary() // 前 置 ++ 
"--" unary() // 前 置 -- 
"4" term() // 一 元 + 
"-" term() // 一 元 - 
"I" term() // 逻辑 非 
"~" term() // 按 位 取 反 
"*" term() // 指针 引用 ( 间接 引用 ) 
"&" term() // 地 址 运算 符 
LOOKAHEAD(3) <SIZEOF> "(" type() ")" // sizeof (类 型 ) 
<SIZEOF> unary () // sizeof 表达 式 
postfix() 





unary () 和 term() 之 间 只 有 微妙 的 差别 ， 那 就 是 能 否 添加 casto term() 可 以 添加 cast, 
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而 unary O 则 不 能 。 这 方面 直接 延 用 了 C 语言 的 规范 。 


F3 后 置 运 算 符 的 规则 








下 面 让 我 们 来 看 一 下 postfix (后 级 ) 的 规则 。 
代码 清单 6.28 postfix 的 规则 ( parser/Parser.jj ) 
postfix(): {} 


{ 













































































primary () 
(orem // 后 置 ++ 
| "oo" // 后 置 n 
| "p" expr () "j" // 数组 引 
| "." name() // 结构 体 或 联合 体 的 成 员 的 引 
| "-»" name() // 通过 指针 的 结构 体 或 联合 体 的 成 员 的 引 
| "(" args() ")" // 函数 调 
)* 
} 
args(): {} 
{ 
[ expr() ("," expr())* ] 


) 
postfix 由 0 个 或 多 个 后 置 的 "++" 等 一 元 运算 符 组 成 。 














这 里 需要 特别 注意 的 是 函数 调用 的 选项 。 一 般 在 进行 函数 调用 时 ， 比 较 多 的 是 用 func | 
name (arg) 这 样 的 形式 ， 所 以 你 可 能 会 认为 函数 调用 的 描述 是 «IDENTIFIER» "(" args () 
") "。 但 事实 上 在 C 语言 的 函数 调用 中 ， Se D ee 如 果 表 达 式 是 单 




















koe 引用 ， 那 就 是 一 般 的 函数 调用 ， 除 此 方法 之 外 还 可 以 通过 函数 指针 来 调用 也 








打字 面 量 的 规则 

















下 面 来 看 一 下 最 后 的 规则 。primary 是 最 后 的 符号 ， 同 时 也 是 最 “小 ”的 符号 。primary 


的 规则 如 代码 清单 6.29 所 示 。 
代码 清单 6.29 primary 的 规则 ( parser/Parser.jj ) 


Primary() : {} 

Í 

«INTEGER» 
«CHARACTER» 
«STRING» 
«IDENTIFIER» 
"(m expr() wm 
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HJ WL, primary 由 <INTEGER> (整数 字面 量 ) «CHARACTER» (字符 字面 量 )、 
«STRING» (字符 串 字 面 量 )、<IDENTIFIER> ( 变量 的 引用 ) 等 组 成 。 

上 述 规则 中 最 后 的 选项 顾 有 意思 ， 我 们 着 重 看 一 下 。 该 选项 的 意思 是 将 expr (RAR) 用 
括号 围 起 来 后 就 成 了 primary。 之 前 都 是 按照 语句 (stmt) 一 表达 式 (expr) 一 项 (term) > 
primary 的 顺序 逐渐 分 解 为 更 小 的 单位 ， 但 在 最 后 的 单位 中 却 可 以 塞 进 表 达 式 。 这 个 颇 为 
有 趣 。 

从 下 一 章 开 始 ， 我 们 将 在 本 章 所 描述 的 语法 中 加 上 代码 来 制作 语法 树 。 














抽象 语法 树 和 中 间 代 码 


第 7 章 JavaCC 的 action 和 抽象 语法 树 





第 8 章 抽象 语法 树 的 生成 





第 9 章 语义 分 析 (1 ) 引用 的 消解 





第 10 章 语义 分 析 (2) 静态 类 型 检查 





第 11 章 中间 代码 的 转换 












JavaCC 的 action 和 
抽象 语法 树 


本 章 我 们 将 学 习 利用 JavaCC 生成 抽象 语法 树 
的 方法 。 
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JavaCC 的 action 








KEHIEN JavaCC 生成 抽象 语法 树 时 所 使 用 的 “action” 这 一 功能 进行 说 明 。 


本 章 的 目的 


上 一 章 中 我 们 描述 了 Cb 的 语法 规则 。 但 仅 有 语法 规则 最 多 只 能 对 源 代码 的 语法 进行 检查 。 
因为 即便 能 够 用 语法 规则 来 识别 语句 或 表达 式 ， 这 样 的 信息 也 不 能 起 到 任何 作用 。 我 们 的 目标 
是 解析 代码 并 生成 语法 树 ， 因 此 必须 在 识别 出 语句 或 表达 式 时 添加 生成 语法 树 的 代码 。 

为 了 达到 上 述 目的 ， 可 以 使 用 JavaCC 中 的 action 功能 。 借 助 action， 当 token 序列 和 语法 
规则 匹配 时 就 能 够 执行 任意 的 Java 代码 。 本 章 将 对 action 的 使 用 方法 进行 说 明 。 


FJ 简单 的 action 

首先 来 看 一 个 action 的 例子 。 我 们 试 着 在 解析 到 Cb 的 结构 体 时 输出 “发 现 了 结构 体 !” 为 
此 ， 我 们 要 在 上 一 章 中 生成 的 结构 体 定 义 规 则 的 基础 上 添加 一 些 处 理 ， 如 代码 清单 7.1 所 示 。 
代码 清单 7.1 action 的 简单 例子 (1) 


void defstruct(): {} 


{ 

















«STRUCT» name () member list() ";" 


Í 
) 


System.out.println(" ZIL T Æ! "); 





只 要 在 符号 串 之 后 写 上 用 “{”“}” 转 起 来 的 Java 代码 ， 那 么 在 解析 到 该 符号 串 时 就 会 执 
行 上 述 代 码 。 

男 外 ,为 了 用 JavaCC 生成 解析 絮 ， 需 要 在 规则 的 开头 标注 该 非 终 端 符号 的 语义 值 。 上 述 符 
号 没有 语义 值 ， 所 以 设 定 为 void 类 型 。 


[F3 383 action 的 时 间 点 
事实 上 ， 不 仅 限于 符号 串 的 未 尾 ，action 可 以 写 在 任何 地 方 。 这 样 当 解 析 进 行 到 写 有 action 
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之 处 时 ，action 就 会 被 执行 。 
请 看 一 下 代码 清单 7.2 的 例子 。 
代码 清单 7.2 ”简单 的 action 的 例子 (2) 


void defstruct(): {} 


( 


«STRUCT» name () 


{ 
} 


member list() 


( 


System.out.println(" 发 现 了 结构 体 ! v); 


System.out.println(" 发 现 了 成 员 列 表 ! ") ; 


"n." 
i 


System.out.println(" 发 现 了 分 号 | "); 


这 次 添加 了 3 Â action, 并且 都 写 在 符号 串 的 中 间 。 让 我 们 考虑 一 下 用 上 述 规则 来 解析 下 面 





的 符号 串 。 
«STRUCT» «IDENTIFIER» " ( " <INT> <IDENTIEFTER> ";™ T } i i 
这 样 的 情况 下 会 按照 如 下 顺序 执行 。 


1. 解析 终端 符号 <STRUCT> 

2. 解析 非 终 端 符号 name () 

3. 执行 第 一 个 action ( 显示 “发 现 了 结构 体 !”) 
4. 解析 非 终端 符号 member list () 

5. 执行 第 二 个 action ( 显示 “发 现 了 成 员 列表 !”) 
6. 解析 终端 符号 rin. 
7. 执行 最 后 的 action ( 显示 “发 现 了 分 号 !”) 















































需要 注意 “解析 终端 符号 ”和 “扫描 终端 符号 ”是 不 同 的 。JavaCC 生成 的 角 








rA 





token 进行 超前 扫描 ， 因 此 即便 是 写 在 action 之 后 的 token， 也 完全 有 可 能 已 经 被 扫描 需 读 取 进 





来 了 。 
例如 下 面 的 规则 ， 在 action 执行 时 «x» 和 «v» 就 已 经 被 扫描 进来 了 。 


LOOKAHEAD(2) { System.out.println("action executed"); ) «X» «Y» 




















但 解析 需 一定 会 在 执行 action 之 后 再 对 «x» 和 «v» 进行 解析 。 


顺便 提 一 下 ,“ 解 析 终 端 符 号 ”在 JavaCC 中 称 为 消费 终端 符号 (consume terminal )。 相 比 


起 来 可 能 还 是 本 书 中 的 称 法 更 形象 ， 更 易于 理解 。 
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[F3 返回 语义 值 的 action 


还 记得 符号 的 语义 值 吗 ?符号 的 语义 值 是 一 些 表示 符号 含义 的 值 。 例 如 对 于 终端 符号 
<INTEGER>， 它 作为 整数 的 值 等 就 是 语义 值 。 

同样 ， 非 终端 符号 也 有 语义 值 。 至 于 把 什么 值 作为 语义 值 ， 不 同 语言 的 处 理 方式 也 不 同 。 
cbc 中 将 抽象 语法 树 的 一 部 分 作为 非 终端 符号 的 语义 值 。 也 就 是 说 ， 如 果 是 表示 表达 式 的 非 终端 
符号 ， 那 么 它 的 语义 值 中 就 保存 有 表达 式 所 对 应 的 语法 树 ; 如 果 是 表示 结构 体 定 义 的 非 终端 符 
^. 那么 其 语义 值 中 就 保存 有 结构 体 所 对 应 的 语法 树 。 

若 要 给 非 终 端 符 号 赋 语 义 值 ， 可 以 使 用 return 语句 从 action 返回 语义 值 。action 返回 语 
义 值 的 例子 如 代码 清单 7.3 所 示 。 
代码 清单 7.3 ”返回 语义 值 的 action 


String defstruct(): {} 


{ 



































«STRUCT» name() member list() ";" 


{ 


return "struct"; 


) 


这 样 就 能 将 非 终端 符号 defstruct 0 的 语义 值 设置 为 "strcut"。 此 时 和 修改 前 有 2 处 区 别 。 

1. 将 规则 的 类 型 修改 为 了 String 

2. 在 action 中 添加 了 return 语句 

只 需 在 action 中 调用 return 就 能 够 返回 符号 的 语义 值 。 当 然 不 仅 限 于 本 例 中 的 常量 ， 通 
过 计算 可 以 得 到 任意 值 并 返回 。 


P 获取 终端 符号 的 语义 什 
JavaCC 的 action 中 不 仅 能 够 为 符号 设置 语义 值 ， 还 能 够 从 已 经 设置 了 语义 值 的 符号 中 获取 
语义 值 。 无 论 是 终端 符号 还 是 非 终 端 符号 ， 都 能 够 获取 规则 中 所 写 的 符号 的 语义 值 并 使 用 。 
首先 ， 获 取 终端 符号 的 语义 值 的 例子 如 代码 清单 7.4 所 示 。 
代码 清单 7.4 ”从 终端 符号 取得 语义 值 


String name(): 


{ 


} 
{ 


) 














Token tok; 


tok-«IDENTIFIER» ( return tok.image; } 
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在 第 1 对 大 括号 中 声明 了 这 个 规则 内 可 用 的 (Java 的 ) 临时 变量 tok。 在 此 作用 域内 可 以 
声明 任意 数量 的 变量 ， 并 且 还 可 以 自由 编写 用 于 初始 化 的 表达 式 。 本 书 中 到 目前 为 止 还 没有 声 
明 过 变量 ， 因 此 这 部 分 一 直 仅 写 为 “{ }”。 

然后 把 声明 的 变量 写成 变量 名 = < 终端 符号 名 >， 就 能 将 终端 符号 的 语义 值 设 置 到 变量 
“=” 两 侧 可 以 加 上 空格 ， 但 考虑 到 规则 中 存在 多 个 符号 的 情况 ， 没 有 空格 的 写法 看 上 去 更 干净 。 

终端 符号 的 语义 值 是 Token 类 的 实例 。Token 类 由 JavaCC 自动 生成 。 在 上 述 例子 中 , 将 
Token 对 象 赋 给 了 临时 变量 tok， 并 且 返 回 tok 中 image 属性 的 值 作为 name () 的 语义 值 。 

一 般 而 言 ， 非 终端 符号 的 规则 可 以 像 下 面 这 样 描述 。 






































语义 值 的 类 型 非 终端 符号 名 参数 列表 


{ 
临时 变量 的 声明 
规则 和 action 
} 





“参数 列表 ”部 分 可 以 用 来 描述 传递 给 非 终 端 符号 的 参数 列表 。 但 cbe 中 一 概 不 使 用 该 参 
数 ， 其 他 的 编译 器 中 使 用 此 参数 的 情况 也 基本 没有 ， 因 此 本 书 中 省 略 对 这 部 分 内 容 的 说 明 。 


F Token 类 的 属性 
Token 类 中 定义 的 属性 (field ) 如 表 7.1 所 示 。 


表 7.1 Token 类 的 属性 

属性 名 含义 

kind 表示 终端 符号 类 型 的 常量 
beginLine token 的 第 1 个 字符 所 在 的 行 号 
beginColumn token 的 第 1 个 字符 所 在 的 列 号 
endLine token 的 最 后 的 字符 所 在 的 行 号 
endColumn token 的 最 后 的 字符 所 在 的 列 号 






























































image token FE 

















next 下 一 个 token ( SPECIAL. TOKEN 除外 ) 
specialToken 下 一 个 SPECIAL_TOKE 


上 述 表 中 ，image 是 特别 常用 的 属性 。 例 如 printf 这 样 的 文本 所 对 应 的 终端 符号 
«IDENTIFIER» 的 image 属性 就 是 字符 串 "printf". 54h, 像 "Hello，World! \n" 这 
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已 


样 的 文本 所 对 应 的 终端 符号 为 «STRING» 的 话 ， 它 的 image 属性 就 是 字符 串 "\"Hello, 


World! \n\""o 











zal 








请 结合 图 7.1 掌握 image 属性 的 作用 。 
printf('Hello, World!) 
扫描 
token 序列 «IDENTIFIER» "(" <STRING> b pi 
image "printf" NHello, World nV" y Es 
7.1 


Token 类 的 image 属性 
关于 Token 类 的 其 他 属性 我 们 也 来 简单 地 了 解 一 下 。 








Hi, kind 属性 


























P 存 放 的 是 表示 这 个 token 的 “类 型 ”的 常量 。 该 常量 定义 在 由 JavaCC 
自动 生成 的 ParserConstants 接口 中 , 像 下 面 这 样 调用 就 
Token token = ( 从 终端 符号 获取 Token 对 象 ; 

String name = ParserConstants.tokenImage [token.kind] 


54H 


能 得 到 字符 串 形 式 的 token 名 。 








beginLine, beginColumn, endLine, endColumn 这 4 个 属性 表示 token 在 源 代码 文 
件 中 的 位 置 。 行 号 和 列 号 都 从 1 开始 。 
最 后 ，next 属性 和 specialToken 


属性 是 连接 token 的 纽带 。 扫 描 器 把 用 TOKEN 扫描 到 
的 token 存放 在 next 属性 


H, JEH sPECIAL TOKEN 扫描 到 的 token 存放 在 specialToken 
属性 中 。 这 个 属性 的 含义 看 图 比较 容易 理解 ， 因 此 请 参考 图 7.2。 




















源 代 码 


int /* comment */ 


main(int argc, char **argv) { 
以 下 省 略 


扫描 


<SPACES> 


^n" 

specialToken | | next 
"/* comment */ 

specialToken | | next 


«SPACES» 


specialToken 


«INT» «IDENTIFIER» 
"int" "main" 


next 


Token 对 象 的 结构 

















<SPACES> 


SpecialToken 


«IDENTIFIER» 
TU 


n "argc" 
next next 


next 
7.2 Token 类 的 next 属性 和 specialToken 属性 
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JH sPECIAL TOKEN 扫描 得 到 的 token 会 被 存放 到 之 后 用 TOKEN 扫描 到 的 token 的 
specialToken 属性 中 。 以 图 7.2 为 例 ， 块 注释 及 其 周围 空白 符 所 对 应 的 token 以 链表 的 形式 
设置 到 下 一 个 <IDENTIFIER>token (main) 的 specialToken 属性 中 。 

所 有 这 些 属性 在 cbe 中 都 会 被 用 到 。 在 获取 错误 消息 中 显示 的 行 号 时 会 用 到 peginLine 
等 属性 。 在 根据 --dump-tokens 选项 生成 token 序列 的 功能 时 会 用 到 king 属性 、next 属性 
和 specialToken 属性 。 









































获取 非 终端 符号 的 语义 值 


让 我 们 回 到 原来 的 话题 ， 接 着 讲 获取 符号 的 语义 值 的 方法 。 刚 才 我 们 已 经 看 了 取得 终端 符 

号 的 语义 值 (Token 对 象 ) 的 例子 ， 这 次 让 我 们 来 看 一 下 取得 非 终端 符号 的 语义 值 的 例子 。 
虽然 这 么 说 ， 其 实 无 论 终端 符号 还 是 非 终端 符号 ， 获 取 语 义 值 的 方法 都 是 相同 的 。 区 别 在 

于 终端 符号 的 语义 值 总 是 Token 对 象 ， 而 非 终端 符号 的 语义 值 的 类 则 根据 符号 不 尽 相同 。 刚 才 

我 们 学 习 了 从 action 返回 语义 值 的 方法 ， 下 面 就 来 看 一 下 非 终端 符号 返回 语义 值 的 情况 。 

举 一 个 简单 的 例子 ， 解 析 到 结构 体 后 显示 “发 现 了 结构 体 x x x X 1”( x x x x 为 结构 体 

的 名 字 ) 的 代码 如 下 所 示 。 



































void defstruct(): 


( 


Sirm 
} 
{ 


«STRUCT» str-name() member list() ";" 


{ 
} 


System.out.println (" EZ T AA "«4stre"!"); 


) 


String name(): 


( 


Token tok; 
j 
{ 


tok=<IDENTIFIER> 


{ 
} 


return tok.image; 


在 上 述 代码 中 ，str=name O 将 非 终 端 符 号 name () 的 语义 值 赋 给 临时 变量 str. TZ 
符号 一 样 ， 只 需 写 “变量 名 = 非 终 端 符号 ”， 就 能 够 获取 非 终 端 符 号 的 语义 值 。 

但 是 如 之 前 所 述 ， 非 终端 符号 的 语义 值 的 类 型 根据 符号 的 不 同 而 各 不 相同 ， 因 此 要 声明 
适当 类 型 的 变量 。 上 例 中 非 终 端 符号 name () 的 语义 值 的 类 型 是 string， 所 以 声明 并 使 用 了 
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String 类 型 的 变量 str。 
在 规则 中 写 非 终端 符号 等 同 于 方法 调用 。 该 方法 能 返回 语义 值 ， 调 用 方 能 够 将 返回 的 语义 
值 赋 给 临时 变量 后 使 用 。 这 样 理解 的 话 是 不 是 简单 很 多 ? 


语法 树 的 结构 


至 今 为 止 我 们 所 见 的 action 都 是 只 输出 了 消息 。 这 次 我 们 来 看 一 个 更 实际 的 例子 。cbc 中 
defstruct () 的 action 如 代码 清单 7.5 所 示 。 
代码 清单 7.5  defstruct 的 规则 


StructNode defstruct(): 


{ 




















Token t; 
String n; 
List<Slot> membs; 


t=<STRUCT> n-name() membs=member_list() ";" 


{ 
} 


return new StructNode (location(t), new StructTypeRef (n), n, membs); 


和 刚才 的 例子 相 比 并 没有 太 大 的 变化 ， 主 要 的 变动 有 以 下 3 处 。 


到 


























1.defstruct 的 语义 值 的 类 型 变 为 了 StructNode 

2. 使 用 了 更 多 符号 的 语义 值 

3. M action 返回 StructNode 对 象 作为 语义 值 

当然 这 里 用 到 的 StructNode 类 需要 自行 定义 。 

关于 StructNode 的 构造 聘 数 各 个 参数 的 含义 ， 稍 后 再 进行 讲解 ， 这 里 先 暂 时 跳 过 。 现 在 
只 要 认识 到 像 这 样 逐个 编写 action 就 能 够 生成 语法 树 就 可 以 了 。 






































选择 和 action 


接着 我 们 再 稍微 细致 地 来 看 一 下 action 的 使 用 方法 。 当 规则 中 存在 选项 时 ， 知 使 用 action, 
就 能 够 为 各 个 选项 分 别 添加 action。 请 看 下 面 的 例子 。 





void choice(): 
{ 


Token x, y; 


X=<X> 
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System.out.println("X found.  image-" 4 x.image); 

) 

| y=<Y> 

{ 
System.out.println("Y found.  image-" -« y.image); 

} 

} 
通过 这 样 的 写法 ， 在 发 现 终端 符号 <X> 的 情况 下 就 会 显示 消息 X found.…， 发 现 终端 符 

















号 «Y» 的 情况 下 就 会 显示 消息 Y found....。 需要 注意 的 是 ， 像 这 样 和 选项 组 合 使 用 后 ， 这 些 
action 之 中 只 有 一 个 会 被 执行 。 
如 果 要 在 所 有 选项 的 最 后 执行 共通 的 action， 可 以 像 下 面 这 样 将 规则 括 起 来 。 














void choice2(): 


( 


} 
{ 


Token x, v 


(X=<X> | YE 
{ 
di (s Jes sut) d 
System.out.println("X found.  image-" «4 x.image); 


) 
else { 
System.out.println("Y found.  image-" 4 y.image); 


} 
} 


上 述 情况 下 需要 注意 临时 变量 x 和 yy 之 间 只 有 一 者 会 被 赋值 。 只 有 选项 所 包含 的 符号 被 解 
析 时 才能 够 取得 符号 的 语义 值 。 以 choice2 为 例 ， 发 现 <X> 时 变量 x 会 被 赋予 Token 对 象 ， 
y 仍 为 null。 同 样 发 现 «v» 时 变量 y ZWIT Token 对 象 ，x 仍 为 null。 

JavaCC 和 Java 一 样 ， 空 白 符 和 换行 是 没有 意义 的 ， 所 以 规则 有 多 种 写法 。 例 如 choice () 
的 规则 可 以 写成 如 下 这 样 简短 的 形式 。 











void choice(): 
( Token x, y; ) 


( 


x-«X» { System.out.println("X found.  image-" + x.image); } 
| yse«Y» ( System.out.println("Y found.  image-" « y.image); ) 


cbc 中 只 有 在 规则 非常 简单 的 情况 下 才 会 采用 这 样 的 写法 。 


重复 和 action 


这 里 讲 一 下 组 合 使 用 重复 规则 和 action 时 的 动作 。 请 看 下 面 的 例子 。 
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void iteration(): 


{ 


} 
{ 


Token x, 3 


C==2 — ye 


{ 
} 


System.out.println("x-" & x.image « "; yz" « y.image); 


)* 





请 注意 这 里 action 写 在 重复 的 括号 中 。 如 果 采 用 这 样 的 写法 ， 每 当 发 现 终端 符 号 exo 
«Y» 的 列 时 ，action 都 会 被 执行 ， 并 显示 x-...; y=.… 这 样 的 消息 。 还 要 注意 这 里 并 非 只 在 整个 
重复 之 后 执行 1 次 action， 而 是 每 次 重复 都 会 执行 action。 

像 x=<X> 这 样 来 获取 语义 值 的 情况 下 ， 在 发 现 所 对 应 的 token 时 ， 会 将 语义 值 赋予 变量 xo 
执行 顺序 如 下 所 示 。 















































































































































1. 发 现 第 1 个 <x>， 将 其 语义 值 赋 给 x 
2. 发 现 第 1 个 <Y>， 将 其 语义 值 赋 给 y 
3. 第 1 次 执行 action 

4. RILE 2 个 <-x>， 将 其 语义 值 赋 给 x 
5. 发 现 第 2 个 <Y>， 将 其 语义 值 赋 给 y 
6. 第 2 次 执行 action 

7. 发 现 第 3 个 «x», TEE Y füllt x 
8. 发 现 第 3 个 <Y>， 将 其 语义 值 赋 给 y 











9. 第 3 次 执行 action 


action 执行 的 情况 如 图 7.3 所 示 。 


token 序列 














执行 action 执行 action 执行 action 
输出 : 输出 : 输出 : 
X=X1; yzy1 X=X2; y=y2 X=X3; y=y3 


图 7.3 重复 和 action ( 1) 
如 果 和 希望 只 在 整个 重复 的 最 后 执行 1 次 action， 可 以 像 下 面 这样 将 action 写 在 括号 之 外 。 











void iteration2(): 


Í 
} 


Token x, yw; 
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pages adig esa <X><Y><X><Y><X><Y>， 在 发 现 了 3 次 重复 的 
<X><Y> 只 执行 1 次 action。 此 时 的 x 和 yy 是 第 3 次 的 <x> 和 <Y> 的 ， 因 此 仅 输 出 第 3 次 
的 <X> «Y» 的 image 的 值 ， 如 图 7.4 所 示 。 





| token 序列 | 
2 action 
输出 : 
X=X3; y=y3 


7.4 重复 和 action ( 2 ) 


FJ AT 


本 节 对 JavaCC 的 action 以 及 语义 值 进 行 了 说 明 。action 和 语义 值 的 相关 内 容 可 以 总 结 为 如 
下 几 点 。 


o 使 用 action 能 够 获取 终端 符号 / 非 终端 符号 的 语义 值 ， 还 能 够 给 非 终端 符号 赋予 语义 1 

€ 终端 符号 的 语义 值 为 Token 类 的 实例 。 从 Token 类 的 属性 中 可 以 取得 token 的 字面 量 及 其 忆 
源 文件 中 的 位 置 等 信息 

e 非 终端 符号 的 语义 值 取 决 于 action。 通 过 在 规则 的 开头 添加 语义 值 的 类 型 ， 并 从 action 返 区 

值 ， 就 可 以 设置 语义 

e 当 解 析 到 规则 中 写 有 action 之 处 时 ，action 才 会 被 执行 。 若 在 符号 串 的 最 后 写 有 action, JF 
么 在 该 符号 串 全 部 被 发 现 后 action 才 会 被 执行 

e 组 合 使 用 选项 和 action， 能 够 编写 只 有 在 发 现 特定 的 选项 时 才 被 执行 的 action 

e 组 合 使 用 重复 和 action， 能 够 编写 在 每 次 重复 时 都 会 被 执行 的 action 
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TEL SR TR 1S DUET A 








本 节 将 介绍 Cb 的 抽象 语法 树 的 相关 内 容 。 


Node 类 群 


一 般 编程 语言 的 抽象 语法 树 由 名 为 节点 (node ) 的 数据 结构 组 成 。 图 7.5 所 示 为 用 各 自 所 对 
应 的 节点 来 表示 语句 、 表 达 式 以 及 变量 等 。 








点 点 
JAN E = J 
dr PEE X dr >E y 


图 7.5 抽象 语法 树 和 节 
cbc 中 用 继承 自 Node 类 的 子 类 来 表示 单个 的 节点 。 继 承 自 Node 的 类 非常 多 。 首 先 Node 
类 的 子 类 的 继承 层次 如 代码 清单 7.6 所 示 ， 这 里 用 缩 进 表示 继承 。 
代码 清单 7.6 Node 类 群 的 继承 层次 
































Node 
AST 抽象 语法 树 的 根 
ExprNode 表示 表达 式 的 节点 
AbstractAssignNode 赋值 

AssignNode 赋值 表达 式 ( = ) 

OpAssignNode 复合 赋值 表达 式 (+=、-=、 oun ) 
AddressNode 地 址 表达 式 ( &x ) 
BinaryOpNode 二 元 运算 表达 式 ( x+y、x-y、…… ) 

LogicalAndNode && 

LogicalOrNode 
CastNode 类 型 转换 
CondExprNode 条 件 运 算 表达 式 (a?b:c) 
FuncallNode 函数 调 表达 式 
LHSNode 能 够 成 为 赋值 的 左 值 的 节点 

ArefNode 数组 表达 式 (alil) 


DereferenceNode 指针 表达 式 ( *ptr ) 
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MemberNode 成 员 表 达 式 ( s .memb ) 
PtrMemberNode 成 员 表 达 式 ( ptr-»memb ) 
VariableNode 变量 表达 式 
LiteralNode 字面 
IntegerLiteralNode 整数 字面 
StringLiteralNode 字符 串 字 面 
SizeofExprNode 计算 表达 式 的 sizeof 的 表达 式 
SizeofTypeNode 计算 类 型 的 sizeof 的 表达 式 
UnaryOpNode 一 元 运算 表达 式 ( +x、-x、……: ) 
UnaryArithmeticOpNode ”前 置 的 ++ 和 -- 
PrefixOpNode 前 置 的 ++ 和-- 
SuffixOpNode 后 置 的 ++ -- 
Slot 表示 结构 体 成 员 的 节点 
StmtNode 表示 语句 的 节点 
BlockNode 程序 块 ({...}) 
BreakNode break 语句 
CaseNode case 标签 
ContinueNode continue 语句 
DoWhileNode do ~ while 语句 
ExprStmtNode 单独 构成 语句 的 表达 式 
ForNode for 语句 
GotoNode goto 语句 
IfNode if 语句 
LabelNode goto 标签 
ReturnNode return 语句 
SwitchNode switch 语句 
WhileNode while 语句 
TypeDefinition 类 型 定义 
CompositeTypeDefinition 结构 体 或 联合 体 的 定义 
StructNode 结构 体 的 定义 
UnionNode 联合 体 的 定义 
TypedefNode typedef 声明 
TypeNode 存储 类 型 的 节点 


Cb 几乎 实现 了 所 有 C 语言 的 语法 ， 所 以 节点 的 种 类 非常 多 。 读 者 看 到 这 么 多 类 可 能 会 感到 
害怕 ， 别 担心 ， 让 我 们 按 种 类 对 其 进行 划分 ， 逐 个 地 来 看 。 首 先 笔者 会 从 直接 继承 自 Node 的 
子 类 中 选取 几 个 重要 的 类 进行 讲解 。 除 此 之 外 的 类 将 在 第 1 次 月 

这 几 个 重要 的 类 如 表 7.2 所 示 。 
表 7.2 比较 重要 的 节点 类 





日 到 时 再 进行 讲解 。 





















































类 名 作用 

AST 表示 抽象 语法 树 的 根 的 节点 类 
StmtNode 表示 语句 的 节点 的 基 类 
ExprNode 表示 表达 式 的 节点 的 基 类 
TypeDefinition 定义 类 型 的 节点 的 基 类 


























AST 类 是 抽象 语法 树 的 根 (root， 树 的 最 上 层 ) 节点 。 
语句 和 表达 式 分 别 由 StmtNode 和 ExprNode 的 子 类 来 表示 。stmt 和 expr 在 语法 规则 
上 是 相当 的 。 例 如 StmtNode 的 子 类 中 定义 有 与 i£ 话 句 对 应 的 IfNode, ExprNode 的 子 类 
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中 定义 有 与 二 元 运算 表达 式 对 应 的 BinaryOpNode。 

和 类 型 的 定义 相关 的 节点 用 TypeDefinition 的 子 类 来 表示 。TypeDefinition 的 子 类 
中 定义 有 表示 结构 体 定义 的 structNode 、 表 示 联 合体 定义 的 UnionNode 以 及 表示 typedef 
语句 的 TypedefNode。 


fF] Node 类 的 定义 
Node 类 的 代码 比较 简单 ， 所 以 这 里 我 们 来 看 一 下 完整 的 代码 ( 代码 清单 7.7 )。 
代码 清单 7.7 Node 类 ( ast/Node.java ) 























package net.loveruby.cflat.ast; 
import java.io.PrintStream; 


abstract public class Node implements Dumpable { 
public Node() ( 


) 


abstract public Location location(); 


public void dump() { 
dump (System.out); 


) 


public void dump (PrintStream s) { 
dump (new Dumper(s)); 


) 


public void dump (Dumper d) { 
d.printClass(this, location()); 
dump (d) ; 


) 


abstract protected void  dump(Dumper d); 





Node 类 并 不 对 应 特定 的 语法 ， 所 以 没有 定义 具体 的 属性 。 以 后 可 能 没有 机 会 说 明 Node 类 
的 方法 ， 因 此 在 这 里 介绍 一 下 。 

Node#1location 是 返回 某 节 点 所 对 应 的 语法 在 代码 中 的 位 置 的 方法 。 一 般 来 说 ， 如 
果 代 码 中 存在 错误 的 话 ， 编 译 右 会 将 出 错 的 语句 或 表达 式 所 在 的 文件 和 行 数 表 示 出 来 ， 
Node#location 方法 就 会 将 这 些 信 息 以 Location 对 象 的 形式 返回 。 


[Py 抽象 语法 树 的 表示 
另 一 方面 Node 类 中 的 dump 方法 和 _aump 方法 是 以 文本 形式 表示 抽象 语法 树 的 方法 。 
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调用 dump 方法 可 以 以 如 下 形式 表示 cbe 的 抽象 语法 树 。 


AS 


variables: 

functions: 
««DefinedFunction»» (misc/zero.cb:1) 
name: "main" 


isPrivate: false 
params: 
parameters: 

««Parameter»» (misc/zero.cb:2) 
muss "eue 
typeNode: int 
««Parameter»» (misc/zero.cb:2) 
name: "argy" 
typeNode: char** 


body: 
««BlockNode»» (misc/zero.cb:3) 
variables: 
stmts: 
««ReturnNode»» (misc/zero.cb:4) 
expr: 


««IntegerLiteralNode»» (misc/zero.cb:4) 
typeNode: int 
value: O0 


在 cbe 命令 中 指定 - -dump-ast 选项 就 可 以 解析 代码 ， 生 成 抽象 语法 树 ， 并 通过 dump 77 
法 来 表示 。 上 面 就 是 执行 cbc --dump-ast misc/zero.cb 命令 后 的 输出 。 
misc/zero.cb 仪 仅 是 返回 0 并 结束 运行 的 程序 ， 如 下 所 示 。 
代码 清单 7.8 misc/zero.cb 














int 
main(int argc, char **argv) 


| 
} 


return 0; 


对 比 一 下 上 述 代码 和 刚才 dump 方法 的 输出 ， 生 成 的 抽象 语法 树 是 什么 样 的 应 该 大 致 有 印 
象 了 吧 。 

<<AST>> 和 <<DefinedFunction>> 表示 节点 的 类 名 。 右 侧 所 显示 的 (misc/zero. 
cb :1) 是 该 节点 对 应 的 语法 所 记载 的 文件 名 和 行 号 。 (misc/zero.cb:1) 表示 名 为 misc/ 
zero.cb 的 文件 的 第 1 行 。 

另外 ， 缩 进 表示 该 节点 被 前 一 个 节点 引用 。 对 应 的 语法 树 如 图 7.6 所 示 ， 请 大 家 结合 图 确 
认 一 下 。 
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<<AST>> 
variables functions 


««DefinedFunction»» 


name:"main" 
isPrivate:false 









params body 


««Parameter»» 






««Parameter»- 


name-arge 
typeNode:int 






name:argy 
typeNode:char* * 
««ReturnNode»» 
expr 


««IntegerLiteralNode»» 
typeNode:int 
value:0 


图 7.6 misc/zero.cb 所 对 应 的 抽象 语法 树 
本 书 之 后 也 会 常用 dump 方法 来 表示 语法 树 。 


[P] 基于 节点 表示 表达 式 的 例子 


为 了 加 深 理 解 ， 我 们 试 着 来 看 一 下 表示 x+y 等 任意 的 二 元 运算 的 节点 一 一 BinaryOpNode 
类 的 代码 。BinaryOopNode 类 的 整体 代码 如 代码 清单 7.9 所 示 。 
代码 清单 7.9 BinaryOpNode 类 ( ast/BinaryOpNode.java ) 








package net.loveruby.cflat.ast; 
import net.loveruby.cflat.type.Type; 


public class BinaryOpNode extends ExprNode { 
protected String operator; 
protected ExprNode left, right; 
protected Type type; 


public BinaryOpNode (ExprNode left, String op, ExprNode right) { 
super(); 
this.operator - op; 
this.left - left; 
this.right - right; 


) 


public BinaryOpNode (Type t, ExprNode left, String op, ExprNode right) { 
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super(); 
this.operator - op; 
this.left - left; 
this.right s right; 
this.type = t; 


public String operator() { 
return operator; 


public Type type() { 
return (type != null) ? type : left.type(); 


public void setType (Type type) ( 
if (this.type !- null) 
throw new Error("BinaryOptüsetType called twice"); 
this.type - type; 


public ExprNode left() ( 
return left; 


public void setLeft(ExprNode left) [ 
this.left - left; 


public ExprNode right() ( 
return right; 


public void setRight(ExprNode right) ( 
this.right = right; 


public Location location() { 
return left.location(); 


protected void  dump(Dumper d) ( 
d.printMember("operator", operator); 
d.printMember("left", left); 
d.printMember("right", right); 


public «S,E» E accept(ASTVisitor«S,E» visitor) ( 
return visitor.visit(this); 
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BinaryOpNode 类 中 定义 了 很 多 方法 ， 但 不 需要 现在 就 全 部 理解 ， 当 前 重要 的 是 理解 和 抽 
象 语法 树 的 结构 相关 的 属性 。BinaryOpNode 类 的 属性 只 有 operator. left 和 Tight 这 3 
个 。 例 如 用 BinaryopNode 表示 x+y 这 样 的 表达 式 时 ，1left 属性 对 应 x, right 属性 对 应 
y, operator 属性 对 应 +o 

最 后 ， 其 他 的 方法 也 简单 地 说 明 一 下 。type 方法 表示 该 表达 式 整体 的 类 型 ,location 
方法 返回 表示 节点 位 置 的 Location 对 象 。 男 外 ， 通 过 定义 _qdump 方法 ,就 可 以 用 - -dump- 
ast 选项 来 输出 该 节点 的 qump。 

像 这 样 将 节点 组 合 起 来 就 能 够 表示 程序 的 整体 。 
? 
hy 


























JJTree 























cbc 中 我 们 自行 编写 了 所 有 的 action 和 节点 类 来 生成 语法 树 ， 但 其 实 可 以 使 用 名 为 JJTree 的 
来 半自动 化 地 生成 action 和 节点 类 。 

关于 是 否 使 用 JJTree 笔者 考虑 了 很 久 ， 最 终 因为 不 喜欢 JJTree 中 将 节点 的 成 员 保存 在 数组 中 
这 种 设计 而 没有 使 用 。 所 谓 将 节点 的 成 员 保存 在 数组 中 ， 以 IfNode 为 例 ， 就 是 指 将 条 件 表 达 式 、 
then 部 分 的 语句 、else 部 分 的 语句 这 3 个 节点 的 对 象 存放 在 1 个 数组 中 。 

特别 是 按照 JJTree 的 处 理 方 式 ， 各 个 节点 的 类 型 不 会 被 分 别 保存 ， 这 样 静 态 语 句 的 强 类 型 优 
势 就 刺 失 列 尽 了 。 对 于 这 点 笔者 非常 在 意 。 也 就 是 说 ， 为 了 取得 IfNode 的 条 件 表达 式 ， 需 要 编写 
(ExprNode)node.jjGetChild(0) 这 样 的 代码 。 但 笔者 不 愿意 这 么 做 ， 不 喜欢 用 数字 指定 成 员 
的 顺序 ， 也 不 喜欢 强制 的 向 下 类 型 转换 (downcast )。 
最 初 笔者 为 节点 类 定义 了 如 下 所 示 的 专用 的 访问 器 ， 但 后 来 又 觉得 既然 都 做 到 这 一 步 了 ， 和 全 
部 手写 也 没有 什么 大 的 差别 ， 所 以 就 彻底 弃 用 JJTree To 
































































































































































































































public class IfNode extends StmtNode { 
public ExprNode cond() { 


return (ExprNode)jjtGetChild(0); 


) 


public StmtNode thenStmt() { 
return (StmtNode)jjtGetChild(1); 


) 


public StmtNode elseStmt() ( 
return (StmtNode)jjtGetChild(2); 





如 果 读 者 对 JJTree 感 兴趣 ， 并 且 不 在 平 上 述 问题 的 话 ， 也 可 以 试 着 用 一 下 JJTree。 








抽象 语法 树 的 生成 


本 章 我 们 将 在 第 6 章 中 设计 的 语法 规则 中 加 入 
Java 代码 来 生成 抽象 语法 树 。 
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) 表达 式 的 抽象 语法 树 





primary 开始 自 下 而 上 地 编写 action。 一 般 来 说 ，JavaCC 是 根据 从 末端 的 规则 返 


从 本 节 开 始 ， 我 们 将 实际 地 在 语法 规则 文件 中 添加 生成 抽象 语法 树 的 action。 第 6 3p JA 
compilation unit () 开始 自 上 而 下 地 对 语法 规则 进行 了 讲解 ， 本 章 则 恰恰 相反 ， 我 们 将 从 





抽象 语法 树 的 ， 所 以 自 下 而 上 的 方法 更 为 合适 。 


本 节 我 们 将 讲解 表达 式 Cexpr) 的 抽象 语法 树 的 生成 。 


字面 量 的 抽象 语法 树 


回 的 值 来 构建 





添加 action 后 的 primary 的 规则 如 代码 清单 8.1 所 示 。 


代码 清单 8.1 字面 量 的 规则 ( parser/Parser.jj ) 


ExprNode primary(): 


{ 


Token t; 
ExprNode n; 


t=<INTEGER> 


{ 
} 


t=<CHARACTER> 


{ 


return integerNode(location(t), t.image); 


return new IntegerLiteralNode (location(t), 


IntegerTypeRef.charRef(), 


characterCode (t.image)); 


) 


t=<STRING> 


{ 


return new StringLiteralNode (location (t), 
new PointerTypeRef (IntegerTypeRef.charRef()), 
stringValue (t.image)); 
t=<IDENTIFIER> 
return new VariableNode (location(t), t.image); 


) 


| " ( " n-expr ( ) " j " 
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return n; 

















JEK miT S primary 是 数值 、 字 符 、 字 符 串 的 字面 量 、 变 量 以 及 用 括号 括 起 来 的 表达 式 
中 的 任意 一 者 。 这 里 为 各 个 选项 生成 对 应 的 节点 对 象 。 对 数值 字面 量 ( 

















符号 -INTEGER» ) ffl 


字符 字面 量 (符号 CHARACTER») 生成 IntegerLiteralNode 对 象 ， 对 字符 串 字 面 量 ( 符 


j F4 





号 «STRING») 生成 stringLiteralNode 对 象 ， 对 变量 (符号 < 
VariableNode 对 象 。 





在 primary 规则 的 action 中 所 使 用 的 Parser 类 的 方法 如 下 所 示 。 


Location location(Token t) 

返回 表示 token t 4z X: $3 Location 对 象 。 

IntegerLiteralNode integerNode(Location loc, String image) 

解析 代码 中 的 文本 image， 并 用 适当 的 参数 生成 IntegerLiteralNode.; 
char characterCode(String image) 

解析 代码 中 字符 字面 量 的 文本 image， 并 返回 字符 编码 。 

String stringValue(String image) 

解析 代码 中 字符 串 字 面 量 的 文本 image， 并 返回 该 字符 串 。 


IDENTIFIER») 生成 





另外 ，IntegerTypeRef .charRef() 和 new PointerTypeRef () 都 是 用 于 生成 
TypeRef 类 的 实例 。TypeRef 类 是 Cb 中 表示 类 型 名 称 的 类 。 


类 型 的 表示 




















这 里 讲 一 下 cbe 中 如 何 表示 类 型 。 





首先 ，cbc 中 类 型 自身 用 Type 类 的 实例 来 表示 。Type 类 的 层次 如 代码 清单 8.2 所 示 。 
代码 清单 8.2. Type 类 的 层次 


Type 


ArrayType 
FunctionType 
IntegerType 
NamedType 
CompositeType 
StructType 
UnionType 
UserType 
PointerType 
VoidType 
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Type 类 的 子 类 分 别 表 示 各 自 的 名 称 所 对 应 的 类 型 。 例 如 ArrayType 表示 数组 类 型 ， 
IntegerType 表示 int I long 这 样 的 整数 类 型 ，UserType 表示 由 typedef 所 定义 的 类 型 。 
cbc 中 除了 Type 类 之 外 ， 还 使 用 了 表示 类 型 名 称 的 TypeRef 类 。TypeRef 类 的 层次 如 代 
码 清单 8.3 所 示 。 
代码 清单 8.3 TypeRef 类 的 层次 


TypeRef 
ArrayTypeRef 
FunctionTypeRef 
IntegerTypeRef 
PointerTypeRef 
StructTypeRef 
UnionTypeRef 
UserTypeRef 
VoidTypeRef 























请 注意 不 要 混淆 Type 类 和 TypeRef 25, Type 类 表示 类 型 的 定义 ，TypeRef 类 表示 类 型 
的 名 称 。 举 例 来 说 ，struct point { int x; int y; ); 是 类 型 的 定义 ，struct point 是 


类 型 的 名 称 。 


为 什么 需要 TypeRef 类 


cbe 中 之 所 以 特意 将 Type 类 和 TypeRef KIF, 是 因为 在 Cb 中 ， 在 类 型 定义 之 前 就 可 
以 编写 用 到 了 该 类 型 的 代码 。 也 就 是 说 ，Cb 中 可 以 编写 如 下 所 示 的 代码 。 























struct s var; 


struct s | 
int memb; 


m 

C 语言 中 是 不 可 以 编写 这 样 的 代码 的 ， 此 处 为 了 迎合 当今 的 趋势 而 特意 修改 了 C 语言 的 规范 。 

如 果 人 允许 编 写 这 样 的 代码 ， 就 会 出 现 一 个 问题 。 以 刚才 的 代码 为 例 ,在 解析 到 var 的 定义 
HN, struct s 这 个 类 型 已 经 出 现 了 ,但 该 类 型 的 定义 却 还 没有 被 解析 到 ， 因 此 此 时 无 法 生成 
struct s 所 对 应 的 Type 对 象 。 

解决 上 述 问题 的 方法 大 致 有 两 种 。 

1. 在 发 现 struct s 这 个 类 型 名 称 时 生成 不 含 任何 信息 的 Type 对 象 ， 当 类 型 的 定义 出 现时 再 
添加 类 型 的 信息 

2. 在 发 现 struct s 这 个 类 型 名 称 时 仅 记 录 名 称 ， 之 后 再 转换 为 Type HR 

无 论 哪 种 方法 ， 都 必须 在 之 后 向 语法 树 中 的 某 处 添加 信息 。 在 考虑 了 哪 一 个 容易 理解 后 ， 
cbc 中 选用 了 第 二 个 方法 。 
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[F3 一 元 运算 的 抽象 语法 树 


让 我 们 回 到 语法 ， 来 看 一 下 一 元 运算 的 规则 (term, unary, postfix) F actions HA 
action 后 的 一 元 运算 的 规则 如 代码 清单 8.4 所 示 。 
代码 清单 8.4 term, unary, postfix 的 规则 ( parser/Parser.jj ) 








ExprNode term(): 


( 


TypeNode t; 
ExprNode n; 


LOOKAHEAD("(" type()) 
"(" t-type() ")" n-term() ( return new CastNode(t, n); } 
| n=unary () { return n; } 


ExprNode unary(): 


( 


ExprNode n; 


TypeNode t; 

} 

{ 
"4-4" n-unary() ( return new PrefixOpNode("««", n); } 
"--" n=unary () ( return new PrefixOpNode("--", n); } 
"+n n-term() ( return new UnaryOpNode("-«", n); } 
"-" n-term() ( return new UnaryOpNode("-", n); } 
"I" n-term() ( return new UnaryOpNode("!", n); } 
"~" n-term() ( return new UnaryOpNode("-", n); } 
"xn n=term() ( return new DereferenceNode(n); } 
"&" n=term() ( return new AddressNode(n); } 
LOOKAHEAD(3) «SIZEOF» "(" t-type() ")" 





{ 
) 


| «SIZEOF» n-unary() 


{ 
} 


| nepostfix() { return n; } 


return new SizeofTypeNode(t, size t()); 


return new SizeofExprNode(n, size t()); 


ExprNode postfix(): 
ExprNode expr, idx; 
String memb; 
List<ExprNode> args; 


expr=primary () 
( rn ( expr = new SuffixOpNode ("++", expr); ] 
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| "--" ( expr = new SuffixOpNode("--", expr); } 
| "[" idxsexpr() "]" ( expr = new ArefNode(expr, idx); } 

| "." memb-name() { expr = new MemberNode (expr, memb); } 

| "-»" memb-name () ( expr = new PtrMemberNode(expr, memb); } 
| "(" args-args() ")" { expr = new FuncallNode(expr, args); } 

) 


{ 
) 


return expr; 


一 元 运算 的 action 都 只 生成 节点 对 象 。 各 个 类 所 表示 的 运算 如 表 8.1 所 示 。 
表 8.1 表示 一 元 运算 的 类 











































































































节点 的 类 名 表示 的 运算 
UnaryOpNode 一 元 运算 +、-、!、~ 
PrefixOpNode 前 置 的 ++ 和 -- 
SuffixOpNode 后 置 的 ++ 和 -- 
DereferenceNode 指针 引用 ( *ptr ) 
AddressNode 地 址 运算 符 ( &var ) 
SizeofTypeNode 对 类 型 的 sizeof 运算 
SizeofExprNode 对 表达 式 的 sizeof 运算 
CastNode 类 型 转换 

ArefNode 数组 引用 Carylil ) 
MemberNode 成 员 引 用 ( st.memb ) 
PtrMemberNode 通过 指针 访问 成 员 (ptr-»memb ) 
FuncallNode 函数 调 








postfix 的 action 结合 了 重复 和 action， 所 以 稍微 难以 理解 。 这 里 只 考虑 通过 指针 访问 成 
员 的 运算 符 ( -> )， 将 其 简化 ， 如 下 所 示 。 


ExprNode postfix(): 


{ 


} 
{ 


ExprNode expr; 


expr=primary () 
( "->" memb=name () { expr = new PtrMemberNode (expr, memb); } )* 


Í 
} 


return expr; 


上 述 规则 表示 primary 之 后 -> M name 重复 0 次 或 多 次 ， 具 体 来 说 就 是 “var”“var- 
”这 样 的 表达 式 。 

述 规则 中 ， 每 次 发 现 “- > x x x” 就 会 执行 一 次 action， 有 多 少 个 -> 就 会 有 多 少 层 
PtrMemberNode 的 般 套 。 例 如 ，x->y->z 这 样 的 表达 式 所 对 应 的 抽象 语法 树 的 dump 如 下 所 示 。 


» &« 


» [13 
>X Vvar-»x-»node  var-»x-»node--»-type 
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<<PtrMemberNode>> (misc/postfix.cb:2) 
expr: 


««PtrMemberNode»-» 
expr: 


(misc/postfix.cb:2) 


««VariableNode»» (misc/postfix.cb:2) 
pame: 1x" 


menas: Uyu 
member: "z" 


[y 二 元 运算 的 抽象 语法 树 
接着 讲 二 元 运算 。 二 元 运算 的 action 和 一 元 运算 的 结构 类 似 ， 都 
套 结构 的 树 ( 代码 清单 8.5 )。 


代码 清单 8.5 expri 的 规则 ( parser/Parser.jj ) 


ExprNode exprl() 
( ExprNode 1, r; } 








fn 


E BERORK E UR 





{ 
l=term() ( "*" r=term() { 1 = new BinaryOpNode(l, "*", r); } 
| "/" r=term() { 1 = new BinaryOpNode(1, "/", r); } 
| "$" r-term() ( 1 = new BinaryOpNode(1, "$", r); } 
)* 
{ 
return 1; 
} 
} 


用 上 述 规则 来 解析 x * y * zo x 作为 第 1 个 term， 其 语义 值 被 赋 给 临时 变量 1。 之 后 ， 当 
发 现 * y 时 ， 执行 action， 生 成 BinaryOpNode 并 赋 给 临时 变量 1。 再 之 后 ， 当 发 现 * z 时 , 执 
行 action， 生 成 BinaryOpNode 并 赋值 给 临时 变量 1。 此 时 1 的 值 就 是 expri 整体 的 语义 值 。 
下 面 是 x * y * z 的 语法 树 的 dump， 请 对 比 着 规则 思考 一 下 处 理 的 过 程 。 

««BinaryOpNode»» (misc/binaryop.cb:2) 


Operator: De 
left: 





««BinaryOpNode»» (misc/binaryop.cb:2) 
operator Uer 


dert: 
««VariableNode»» (misc/binaryop.cb:2) 
namen 

right: 
««VariableNode»» (misc/binaryop.cb:2) 
name: "y" 

aa 
««VariableNode»» (misc/binaryop.cb:2) 
meum Ue 








二 元 运算 符 无 论 规 则 还 是 action 都 差不多 。 人 代码 清单 8.6 是 expr2 的 规则 ， 可 以 看 出 和 
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expri 的 规则 形式 完全 相同 。 其 他 的 二 元 运算 符 也 几乎 完全 一 样 ， 这 里 就 省 略 说 明了 。 
代码 清单 8.6 expr2 的 规则 ( parser/Parser.jj ) 


ExprNode expr2(): 
( ExprNode 1, r; } 


{ 


l=expr1() ( "+" rzexprl() = new BinaryOpNode(l, "+", r); } 


(ai 
| "-" rsexprl() ( 1 = new BinaryOpNode(1l, "-", r); } 


FJ 条 件 表达 式 的 抽象 语法 树 

这 次 让 我 们 跳 过 一 些 二 元 运算 符 ， 来 看 一 下 expr8 (&& 运算 符 ) 和 expr9 ( | | 运算 符 )， 
以 及 C 语 言 (Cb) 中 唯一 的 三 元 运算 符 ---- 条 件 表达 式 (a?b:c) 的 规则 。expr8、expr9、 
expr10 的 规则 如 代码 清单 8.7 所 示 。 
代码 清单 8.7 expr8、expr9、expr10 的 规则 ( parser/Parser.jj ) 








ExprNode expr8(): 
{ ExprNode 1l, r; } 


{ 


l=expr7() ("&&" r=expr7() ( 1 = new LogicalAndNode(1, r); })* 


{ 
} 


return 1; 


) 


ExprNode expr9(): 
{ ExprNode 1l, r; } 
{ 
l=expr8() ("||" r=expr8() ( 1 = new LogicalOrNode(1, r); ))* 


{ 
} 


return 1; 


) 


ExprNode expr10(): 
( ExprNode c, t, e; ] 
{ 
c=expr9() ["?" tzexpr() ":" ezexpr10() 
( return new CondExprNode(c, t, e); }] 


Í 
} 


return Cc; 
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LogicalAndNode 类 表示 && 运算 ，LogicalorNode 类 表示 | | 运算 ，CondExprNode 
类 表示 条 件 运算 。 

将 这 3 个 规则 放 在 一 起 介绍 是 因为 它们 属于 控制 结构 。 你 可 能 并 不 认为 && 和 | | 是 控制 结 
构 ， 但 事实 上 对 于 编译 器 来 说 ，&&、| | 和 if 语句 非常 相近 。 

例如 有 如 下 C 语言 的 表达 式 。 





























io ready() && read file(fp); 


上 述 表 达 式 只 有 在 ioe_readqy() 的 返回 值 为 真 ( 非 0 的 数值 ) 时 才 会 执行 read 
file (fp)。 即 和 下 面 的 写法 动作 是 类 似 的 。 








ee 
read file(fp); 
} 


赋值 表达 式 的 抽象 语法 树 


最 后 来 看 一 下 赋值 表达 式 的 规则 。 请 看 代码 清单 8.8。 
代码 清单 8.8 expr 的 规则 ( parser/Parser.jj ) 








ExprNode expr(): 


( 


ExprNode lhs, rhs, expr; 
String op; 


LOOKAHEAD(term() "=") 
lhs-term() "=" rhszexpr() 


{ 
} 


| LOOKAHEAD (term() opassign op()) 
lhs-term() op=opassign op() rhs=expr() 
{ 
} 
| expr=expr10 () 


{ 
} 


return new AssignNode (lhs, rhs); 


return new OpAssignNode(lhs, op, rhs); 


return expr; 


) 


String opassign opO: {} 

{ 
("+=" { return "+"; } 
| Tias esit ( return "-"; } 


| 二 { return "*"; } 
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return "/" 
return Tg" 


return TETs 
return "|" 
^ 


—— —— a a 


return "^n" 
return "««"; } 
return "»»"; ] 


VO — $ os c 


^ 
^ 
ll 


一 


M 
V 
ll 





首先 讲 一 下 expr 的 action 中 用 到 的 临时 变量 1hs 和 rhs 的 名 字 。 单 词 LHS、RHS 是 
编程 语言 的 话题 中 经 常 使 用 的 简称 ， 赋 值 的 左边 称 为 LHS ( Left-Hand-Side )， 右 边 称 为 RHS 
(Right-Hand-Side )。 请 记 住 这 两 个 简称 。 

其 次 ， 请 注意 这 次 的 规则 和 之 前 的 二 元 运算 在 规则 的 形式 上 存在 差异 ， 这 样 的 差异 是 因为 
运算 符 的 结合 性 (associativity ) 不 同 而 产生 的 。 

1-2-3 这 样 的 表达 式 如 果 加 上 括号 的 话 就 是 (1-2) -3， 同 样 1/2/3 的 话 是 (1/2) /3。 但 
是 i=j=1 并 非 (i=j)=1, 而 是 i=(j=1)。 

一 般 来 说 ， 如 果 x OP y OP z 的 含义 为 (x OP y) OP z， 则 称 运算 符 OP 为 左 结合 (left 
associative )， 如 果 含 义 为 x OP (y OP z) ， 则 称 运算 符 OP 为 右 结 合 (right associative )。- 和 / 
等 之 前 出 现 过 的 二 元 运算 符 都 是 左 结合 的 ， 只 有 赋值 运算 符 = 是 右 结合 的 。 

一 般 来 说 ，5-3-1 或 i=j=1 这 样 可 以 连 写 的 二 元 运算 符 的 规则 有 2 种 写法 。 第 1 种 是 和 
现 有 的 模式 相同 ， 如 下 这 样 使 用 * 的 写法 。 









































exprl() ("-" expr1())* 
第 2 种 是 这 次 的 赋值 表达 式 中 用 到 的 使 用 规则 递归 的 方法 。 


expr(): {} 
( 


term() "z" expr() 


) 
事实 上 无 论 使 用 哪 种 写法 ， 解 析 得 到 的 程序 都 是 相同 的 ， 但 在 生成 语法 树 时 会 产生 差异 。 

译 需 在 处 理 时 是 从 位 于 语法 树 下 层 的 节点 开始 依次 进行 的 ， 所 以 当 运 算 符 是 左 结合 时 ， 
越 是 左 侧 的 表达 式 越 是 位 于 下 层 ( 图 8.1 )。 此 时 从 左 侧 开 始 依次 生成 节点 比较 方便 ， 即 重复 第 
1 种 模式 〈 使 用 * ) 即 可 。 

男 一 方面 ， 运 算 符 是 右 结 合 的 情况 则 相反 ， 如 图 8.2 所 示 ， 越 是 右 侧 的 表达 式 的 节点 越 是 
位 于 下 层 ， 即 从 右 侧 的 表达 式 开始 依次 生成 节点 比较 方便 。 因 此 比 起 使 用 JavaCC 的 * 模式 ， 
使 用 规则 的 递归 进行 重复 处 理会 更 为 方便 。 





E 
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表达 式 :1-2-3 (2 [ 


O OV 
E82 右 结合 的 运算 符 的 表达 式 
随便 提 一 下 ， 还 存在 既 非 左 结合 也 非 右 结 合 的 二 元 运算 符 。 例 如 Java 的 ==， 因 此 x==y 
--z 这 样 的 表达 式 的 语法 是 错误 的 。 像 这 样 不 允许 x OP y OP z 的 运算 符 称 为 非 结 合 (non- 


associative ) 运算 符 。Java 的 == 就 是 非 结 合 的 。 
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语句 的 抽象 语法 树 











本 节 中 将 以 证 语句 (stmt) fll while 语句 以 及 程序 块 为 代表 ， 讲解 语句 的 抽象 语法 树 的 


if 语句 的 抽象 语法 树 


首先 ，if 语句 (i£ stmt) 的 规则 如 代码 清单 8.9 所 示 。 
代码 清单 8.9 if stmt 的 规则 ( parser/Parser.jj ) 


IfNode if stmt(): 


{ 





Token t; 
ExprNode cond; 
StmtNode thenBody, elseBody - null; 


t=<IF> "(" cond-expr() ")" thenBody-stmt () 
[LOOKAHEAD(1) «ELSE» elseBody-stmt()] 


{ 
) 


return new IfNode(location(t), cond, thenBody, elseBody); 


if 语句 是 用 IfNode 类 来 表示 的 。iE 的 规则 中 并 没有 特别 复杂 之 处 ， 所 以 让 我 们 直接 看 
一 下 语法 树 的 dump. 





<<IfNode>> (misc/if.cb:3) 
cond: 
««IntegerLiteralNode»» (misc/if.cb:3) 
typeNode: int 
value: 1 
thenBody: 
««BlockNode»» (misc/if.cb:3) 
variables: 
stmts: 
<<ReturnNode>> (misc/if.cb:3) 
expr: 
<<IntegerLiteralNode>> (misc/if.cb:3) 
typeNode: int 
welue: 0 
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elseBody: 
««BlockNode»» (misc/if.cb:3) 
variables: 
stmts: 
««ReturnNode»» (misc/if.cb:3) 
expr: 


««IntegerLiteralNode»» (misc/if.cb:3) 
typeNode: int 
value: 7 


上 述 输 出 是 如 下 语句 的 语法 树 的 dump。 
if (1) { return 0; } eise { return 7; } 


另外 ，IfNode 类 的 构造 函数 的 第 1 个 参数 取得 1ocation(t) (location 对 象 ), 但 
之 前 很 多 节点 的 构造 函数 中 都 是 没有 Location 对 象 的 参数 的 。 但 是 所 有 的 节点 类 都 定义 了 
location 方法 ,使 用 - -qump -ast 选项 dump 话 法 树 ， 就 会 输出 所 有 节点 的 文件 名 和 行 号 。 那 
么 构造 函数 中 不 包含 Location 对 象 参 数 的 节点 究竟 是 如 何 获取 自身 的 Location 对 象 的 呢 ? 

答案 是 “从 自身 所 持 有 的 其 他 节点 获取 ”。 例 如 BinaryopNode 类 的 location 方法 就 是 
直接 调用 左 侧 表达 式 的 location 方法 并 将 其 结果 返回 。 例 如 1+3 这 样 的 表达 式 ，1 的 位 置 就 
是 整体 表达 式 的 位 置 。 


while 语句 的 抽象 语法 树 


接着 让 我 们 来 看 一 下 while 语句 的 规则 (代码 清单 8.10 )。 
代码 清单 8.10 while stmt 的 规则 ( parser/Parser.jj ) 























WhileNode while stmt(): 


( 


Token t; 
ExprNode cond; 
StmtNode body; 


t-«WHILE» "(" cond-expr() ")" body-stmt () 


{ 
} 


return new WhileNode (location(t), cond, body); 


while 语句 (while stmt) 的 action 非常 简单 ， 仅 仅 是 依据 Location 对 象 、 条 件 表达 
式 以 及 while 语句 本 体 的 节点 来 生成 WhileNode 节点 。 我 们 同样 来 看 一 下 语法 树 的 dump。 
««WhileNode»» (misc/while.cb:3) 


cond: 
««IntegerLiteralNode»» (misc/while.cb:3) 
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typeNode: int 
value: 1 
body: 
««BlockNode»» (misc/while.cb:3) 
variables: 
stmts: 
««ReturnNode»» (misc/while.cb:3) 
expr: 
««IntegerLiteralNode»» (misc/while.cb:3) 
typeNode: int 
value: 0 


上 述 输 出 就 是 如 下 语句 的 语法 树 的 dump。 


while (1) ( return 0; ) 


程序 块 的 抽象 语法 树 


作为 第 3 个 语句 (stmt ) 的 语法 树 的 例子 ， 我 们 来 讲 一 下 程序 块 的 抽象 语法 树 的 生成 。 表 
示 程 序 块 的 符号 是 block， 它 的 规则 如 代码 清单 8.11 所 示 。 
代码 清单 8.11 block 的 规则 ( parser/Parser.jj ) 


BlockNode block(): 


{ 





Token t; 
List<DefinedVariable> vars; 
List<StmtNode> stmts; 





t="{" vars-defvar list() stmts-stmts() ")" 


Í 
} 


return new BlockNode (location(t), vars, stmts); 


Cb 和 C 语言 一 样 ， 只 能 在 块 的 起 始 处 声明 临时 变量 ， 因 此 block 的 语法 可 以 理解 为 变量 
声明 的 列表 和 语句 列表 的 排列 。 用 于 表示 程序 块 的 节点 BlockNode 也 同样 包含 了 临时 变量 声 
明 的 列表 和 语句 的 列表 。 这 里 的 列表 是 直接 用 Java 的 列表 类 来 实现 的 。 

也 有 一 些 编译 需 提 供 了 “表示 某 些 列表 的 节点 "。 语 法 树 所 使 用 的 数据 结构 应 该 尽 可 能 地 
聚合 到 节点 内 以 便 统 一 处 理 。 但 cbe 优先 考虑 到 缩减 节点 类 的 数量 ， 所 以 直接 使 用 了 Java 的 
Listo 

接着 来 看 一 下 表示 变量 声明 列表 的 defvar_1ist 和 表示 语句 列表 的 stmts 的 规则 。 
defvar list 将 在 下 一 方 中 介 绍 ， 先 来 看 一 下 stmts 的 规则 ， 如 代码 清单 8.12 所 示 。 
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代码 清单 8.12 stmts 的 规则 ( parser/Parser.jj ) 


List«StmtNode» stmts(): 


List«StmtNode» ss = new ArrayList«StmtNode»(); 
StmtNode s; 


(sestmt() { if (s != null) ss.add(s); })* 


{ 
} 


return ss; 


stmts 是 stmt 的 列表 ， 因 此 用 JavaCC 的 * 模式 对 stmt 进行 遍历 即 可 。 这 里 的 stmt 可 
以 是 if WA, while 语句 以 及 其 他 所 有 的 语句 。 如 果 忘 记 了 stmt 的 规则 ， 可 以 复习 一 下 第 6 
章 中 的 相关 内 容 。 

action 在 每 次 发 现 stmt 时 都 会 将 其 语义 值 ( 即 表示 一 个 语句 的 节点 ) 添加 到 Java 的 列表 
对 象 中 ， 并 最 终 返 回 该 列表 对 象 。 
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语法 树 











本 节 将 介绍 函数 声明 以 及 变量 声明 所 对 应 的 抽象 语法 树 的 生成 。 


变量 声明 列表 的 抽象 语法 树 


首先 我 们 来 看 一 下 刚才 在 程序 块 中 出 现 过 的 变量 声明 的 规则 。 代 码 清单 8.13 就 是 加 入 了 
action 的 变量 声明 的 规则 。 


代码 清单 8.13  defvar list 的 规则 ( parser/Parser.jj ) 














List«DefinedVariable» defvar list(): 


{ 


List«DefinedVariable» result = new ArrayList<DefinedVariable>(); 
List<DefinedVariable> vars; 





( vars-defvars() { result .addAll (vars); ) )* 


{ 
} 


return result; 





上 述 规则 无 论 是 规则 还 是 action 都 和 之 前 的 stmts 类 似 ， 但 区 别 在 于 defvars 的 语义 值 
并 非 变量 声明 ， 而 是 变量 声明 的 列表 。 之 所 以 存在 这 样 的 区 别 ， 是 因为 C 语言 (Cb ) 中 可 以 如 
下 这 样 在 一 个 声明 中 同时 声明 多 个 变量 。 

















sas S92 S9. fap /* 声明 int 类 型 的 变量 x、y、z */ 
cbe 的 defvars 的 语义 值 为 变量 声明 ( 表示 变量 声明 的 节点 ) 的 列表 就 是 为 了 处 理 上 述 情 
况 。 让 我 们 看 一 下 表示 变量 声明 的 defvars 的 规则 并 试 着 思考 一 下 ( 代码 清单 8.14 )。 
代码 清单 8.14 ”defvars 的 规则 ( parser/Parser.jj ) 





List«DefinedVariable» defvars(): 
{ 
List«DefinedVariable» defs = new ArrayList<DefinedVariable>(); 
boolean priv; 
TypeNode type; 
String name; 
ExprNode init = null; 
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priv-storage() type-type() name-name() ["=" init=expr()] 
{ 
defs.add(new DefinedVariable(priv, type, name, init)); 
init = null; 
} 
( "," name-name() ["=" init-expr()] 
{ 
defs.add(new DefinedVariable(priv, type, name, init)); 
init = null; 


return defs; 





表示 变量 声明 的 节点 DefineVariable 的 构造 函数 有 4 个 参数 。 第 1 个 参数 为 表示 是 否 
X static 的 boolean 值 , 第 2 个 为 变量 的 类 型 ,第 3 个 为 变量 名 ,第 4 个 为 初始 化 表达 式 。 

如 前 所 述 ，Cb 可 以 一 次 声明 多 个 变量 ， 因 此 声明 多 个 变量 时 就 需要 生成 相同 数量 的 
DefinedVariable 节点 对 象 。 声 明 时 static 和 变量 的 类 型 只 写 一 次 ， 所 以 从 第 2 次 开始 生 
JX De£inedVariable 对 象 时 就 直接 使 用 临时 变量 priv 和 type。 因 为 各 个 变量 只 有 init 
(初始 化 表达 式 ) 的 值 是 不 同 的 ， 不 能 重复 使 用 ， 所 以 action 中 每 次 生成 DefinedVariable 
对 象 后 就 将 init 设置 回 nul1。 


F 函数 定义 的 抽象 语法 树 


在 介绍 变量 的 定义 之 后 ,我 们 再 来 看 一 下 函数 定义 的 规则 。 函 数 定义 的 规则 如 代码 清单 
8.15 所 示 。 
代码 清单 8.15 defun 的 规则 ( parser/Parser.jj ) 

















DefinedFunction defun(): 
{ 
boolean priv; 
TypeRef ret; 
String n; 
Params ps; 
BlockNode body; 


priv-storage() ret-typeref() n-name() "(" ps-params() ")" body-block() 
{ 
TypeRef t = new FunctionTypeRef (ret, ps.parametersTypeRef()); 
return new DefinedFunction(priv, new TypeNode(t), n, ps, body); 
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这 里 讲 一 下 action 的 含义 。 首 先 非 终端 符号 params 的 语义 值 Params 是 以 TypeNode JÉ 
式 存储 的 各 个 形 参 的 类 型 ， 所 以 不 能 直接 传 给 new FunctionTypeRef () ,需要 先 将 Params 
中 保存 的 值 从 TypeNode 转化 为 TypeRef 类 型 。 这 个 转换 过 程 就 是 action 第 1 行 中 的 ps . 
parametersTypeRef () 的 处 理 。 

接着 利用 该 函数 的 返回 值 TypeRef 和 形 参 的 TypeRef 来 生成 FunctionTypeRef end 

第 1 行 生 成 FunctionTypeRef 后 ,在 第 2 行 生 成 DefinedFunction 对 象 ， 其 构造 
数 的 参数 有 5 个 ， 分 别 为 表示 是 否 为 static 的 boolean 值 . 存 有 FunctionTypeRef i 
TypeNode, KAZ. dx ASSUM Params 对 象 以 及 表示 函数 本 体 的 节点 。 


/多 ) 表示 声明 列表 的 抽象 语法 树 


已 经 介绍 得 差不多 了 ， 下 面 我 们 来 看 一 下 表示 声明 列表 的 抽象 语法 树 的 生成 。 表 示 声 明 列 
表 的 非 终端 符号 top defs 的 规则 如 代码 清单 8.16 所 示 。 
代码 清单 8.16 top_defs 的 规则 ( parser/Parser.jj ) 


Declarations top defs(): 


{ 
































Declarations decls = new Declarations (); 
DefinedFunction defun; 
List<DefinedVariable> defvars; 

Constant defconst; 

StructNode defstruct; 

UnionNode defunion; 

TypedefNode typedef; 


( LOOKAHEAD (storage () typeref() «IDENTIFIER» "(") 


defun=defun () { decls.addDefun (defun); } 
| LOOKAHEAD (3) 
defvars=defvars () { decls.addDefvars (defvars); } 
| defconst-defconst() ( decls.addConstant (defconst); } 
| defstruct-defstruct() { decls.addDefatenotidefaktncE): } 
| defunion=defunion () { decls.addDefunion(defunion); } 
| typedef=typedef () { decls.addTypedef (typedef); } 
) 


{ 
} 


return decls; 


声明 的 列表 由 名 为 Declarations MR: Declarations 节点 分 别 以 列表 的 


JÉ SIE T PRICE X. (DefinedqFunction )、 变 量 定 义 (DefinedVariable)、 常 量 定 


X (Constant )、 结 构 体 定义 ( StructNode ), pudor (UnionNode )、 用 户 类 型 定义 
(TypedefNode )。 
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解析 完 所 有 声明 的 列表 后 ， 最 终 将 保存 有 所 有 声明 信息 的 Declarations 节点 作为 语义 值 
返回 并 结 
m 表示 程序 整体 的 抽象 语法 树 


最 后 讲 一 下 表示 程序 整体 的 抽象 语法 树 的 生成 。 如 前 所 述 ， 表 示 程 序 整 体 的 节点 是 AST 类 
( 代码 清单 8.17 )。 
代码 清单 8.17 compilation_unit 的 规则 ( parser/Parser.jj ) 

















AST compilation unit(): 


( 


Token t; 
Declarations impdecls, decls; 


{ 
) 


impdecls-import stmts() decls-top defs() <EOF> 


( 


t = getToken(1); 


decls.add(impdecls); 
return new AST(location(t), decls); 


首先 出 现 的 是 我 们 未 曾 见 过 的 函数 调用 getToken (1) 。 该 方法 是 JavaCC 预先 定义 在 
Parser 类 中 的 方法 ， 用 于 在 执行 action 时 读 入 第 1 个 还 未 消费 的 token。 因 此 上 述 情况 下 总 是 
返回 整个 文件 的 第 1 个 token。AST 节点 会 保存 这 个 token， 在 指定 - -dump-tokens 选项 来 显 
示 token 序列 时 使 用 。 

另外 ， 可 编译 的 文件 (* .cb ) H import 声明 的 列表 (import _stmts) 和 声明 列表 
(top defs) 组 成 。 它 们 的 语义 值 都 是 Declarations 对 象 ， 所 以 调用 Declarations 类 
的 add 方法 将 两 者 合并 后 生成 AST 节点 。 


外 部 符号 的 import 


刚才 在 compilation unit 的 规则 中 出 现 了 import_stmts， 让 我 们 来 简单 地 看 一 下 。 
import stmts 的 规则 如 代码 清单 8.18 所 示 。 
代码 清单 8.18 import_stmts 的 规则 ( parser/Parser.jj ) 
































Declarations import stmts(): 


String libid; 
Declarations impdecls - new Declarations(); 
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(libid-import stmt () 


{ 
try ( 
Declarations decls - loader.loadLibrary(libid, errorHandler); 


if (decls !- null) { 
impdecls.add(decls); 
addKnownTypedefs (decls.typedefs()); 


) 
} 


catch (CompileException ex) { 
throw new ParseException(ex.getMessage()); 


return impdecls; 


上 述 规则 的 action £A import 声明 所 指定 的 文件 并 进行 解析 ， 将 文件 中 记述 的 函数 和 类 
型 的 声明 添加 到 Declarations 对 象 中 并 返回 。 

表示 import 文件 中 记述 的 函数 、 变 量 以 及 类 型 的 声明 的 类 如 表 8.2 所 示 。 
表 8.2 ”表示 声明 的 类 












































类 名 表示 的 声明 
UndefinedFunction 函数 
UndefinedVariable 变量 
StructNode 结构 体 
UnionNode 联合 体 
TypedeNode typedef 


结构 体 、 联 合体 、typedef 所 对 应 的 节点 在 import 文件 内 外 都 是 一 样 的 ， 而 函数 和 变量 
则 用 Undefinedx x x x 类 取代 了 Definedxxxx 类。 











到 这 里 解析 和 抽象 语法 树 生 成 的 相关 内 容 就 都 讲解 完了 。 最 后 我 们 来 看 一 段 程序 的 抽象 语 
法 树 的 dump， 其 中 包含 了 几乎 所 有 本 章 中 讲 过 的 节点 。 首 先 ， 源 程序 如 下 所 示 。 








import stdio; 
import stdlib; 


int 
main(int argc, char **argv) 


{ 








a (qu) q 

EeeEUEm du] 3 db e y 
} 
else { 

Salie (ab) $ 


上 述 程序 的 抽象 语法 树 如 下 所 示 。 





««AST»» (misc/ast.cb:1) 
variables: 
functions: 
««DefinedFunction»» (misc/ast.cb:4) 
name: "main" 
isPrivate: false 
params: 
parameters: 
««Parameter»» (misc/ast.cb:5) 
name: targe" 
typeNode: int 
<<Parameter>> (misc/ast.cb:5) 
mewes "use 
typeNode: char** 
body: 
««BlockNode»» (misc/ast.cb:6) 
variables: 
««DefinedVariable»» (misc/ast.cb:7) 
name: "i" 
isPrivate: false 
typeNode: int 
initializer: null 
««DefinedVariable»» (misc/ast.cb:7) 
name: "j" 
isPrivate: false 
typeNode: int 
initializer: 





««IntegerLiteralNode»» (misc/ast.cb:7) 
typeNode: int 
value: 5 
stmts: 
««IfNode»» (misc/ast.cb:9) 
cond: 
««VariableNode»» (misc/ast.cb:9) 
name: "i" 
thenBody: 
««BlockNode»» (misc/ast.cb:9) 
variables: 
stmts: 
««ReturnNode»» (misc/ast.cb:10) 
expr: 
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««BinaryOpNode»» (misc/ast.cb:10) 


operator Lo, 
left: 
««BinaryOpNode»» (misc/ast.cb:10) 
opendoen M 
dert: 
««VariableNode»» (misc/ast.cb:10) 
name aa 
right: 


««IntegerLiteralNode»» (misc/ast.cb:10) 
typeNode: int 


value: 1 
right: 
««VariableNode»» (misc/ast.cb:10) 
Domeka 
elseBody: 
<<BlockNode>> (misc/ast.cb:12) 
variables: 
stmts: 
<<ExprStmtNode>> (misc/ast.cb:13) 
expr: 
<<FuncallNode>> (misc/ast.cb:13) 
expr: 


<<VariableNode>> (misc/ast.cb:13) 
name: "exit" 
args: 
<<IntegerLiteralNode>> (misc/ast.cb:13) 
typeNode: int 
valera 


本 章 中 并 没有 对 所 有 符号 所 对 应 的 节点 的 构造 进行 讲解 ,但 只 要 使 用 cbc 命令 的 - -dump- 
ast 选项 ， 就 能 够 看 到 任意 Cb 程序 的 抽象 语法 树 。 实 际 看 一 下 抽象 语法 树 就 会 发 现 非常 容易 理 
解 ， 所 以 请 一 定 试 着 输出 一 下 各 类 程序 的 抽象 语法 树 。 
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cbc 的 解析 器 的 启动 





本 市 将 介绍 cbe 的 解析 需 的 启动 方法 。 


Parser 对 象 的 生成 











cbe 的 解析 需 除 了 JavaCC 的 定义 以 外 还 需要 其 他 属性 ， 为 了 初始 化 这 些 








"uni 


了 专门 的 构造 函数 ， 如 下 所 示 。 
代码 清单 8.19 Parser 类 的 属性 和 构造 函数 ( parser/Parser.jj ) 


private String sourceName; 

private LibraryLoader loader; 
private ErrorHandler errorHandler; 
private Set«String» knownTypedefs; 


public Parser(Reader s, String name, LibraryLoader loader, 
ErrorHandler errorHandler, boolean debug) ( 
this(s); 
this.sourceName - name; 
this.loader - loader; 
this.errorHandler - errorHandler; 
this.knownTypedefs = new HashSet«String»(); 
if (debug) { 
enable tracing(); 
} 
else ( 
disable tracing(); 


} 
} 


这 个 构造 函数 所 设置 的 属性 的 含义 如 下 。 
private String sourceName 

源 程 序 文件 的 文件 名 

private LibraryLoader loader 

用 import 关键 字 读 入 import 文件 的 加 载 器 
private ErrorHandler errorHandler 

处 理 错 误 或 警告 的 对 象 





属性 ， 解 析 需 定义 
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private Set<String>knownTypedefs 
保存 用 typedef 定义 的 类 型 名 称 的 表 


当 第 5 个 参数 debug 为 true 时 ， 通 过 调用 enable tracing 方法 来 启用 JavaCC 的 跟 
踪 (trace) 功能 。 在 cbe 命令 中 指定 --debug-parser 选项 ， 就 能 够 看 到 使 用 跟踪 功能 输出 
的 log。 

为 了 使 用 JavaCC 的 跟踪 功能 ， 还 必须 在 options 块 中 将 DEBUG PARSER 选项 设置 为 
true。 因 为 可 以 通过 enable tracing 方 法 和 disable tracing 方法 来 控制 跟踪 功能 的 
FX, HLI DEBUG PARSER 选项 可 以 一 直 设 置 为 true。 

另外 , 将 DEBUG TOKEN MANAGER 选项 设置 为 true 后 会 输出 扫描 器 的 debug 信息 。 但 
这 个 选项 输出 信息 的 粒度 非常 细 ， 并 不 像 DEBUG_PARSER 那么 有 用 。 


文件 的 解析 


按照 至 今 为 止 的 做 法 ， 解 析 器 只 能 从 流 (stream ) 读 入 代码 。 但 在 解析 代码 时 ， 绝 大 多 数 的 
情况 下 都 是 从 文件 读 取 代码 。 因 此 从 可 用 性 的 角度 来 说 ， 如 果 有 直接 解析 文件 的 方法 的 话 会 方 
便 很 多 。 在 这 个 方法 中 生成 从 文件 读 人 代码 的 解析 器 ， 同 时 在 Parser 类 中 定义 执行 解析 的 更 
态 方法 parseFile。 上 述 内容 如 代码 清单 8.20 所 示 。 
代码 清单 8.20 ”Parser#parseFile 方法 ( parser/Parser.jj ) 






































Static public AST parseFile(File file, LibraryLoader loader, 
ErrorHandler errorHandler, boolean debug) 
throws SyntaxException, FileException { 

return newFileParser(file, loader, errorHandler, debug).parse(); 


) 
首先 用 病态 方法 newFileParser FEWER ATI EUTSS, JPJSFH parse 方法 开始 
fitr, newFileParser 和 parse 都 是 cbe 自行 定义 的 方法 ， 让 我 们 依次 来 看 一 下 它们 的 实现 。 
静态 方法 newFileParser 的 代码 如 代码 清单 8.21 所 示 。 
代码 清单 8.21 ”Parser#newFileParser 方法 ( parser/Parser.jj ) 





Static final public String SOURCE ENCODING = "UTF-8"; 


static public Parser newFileParser(File file, 
LibraryLoader loader, 
ErrorHandler errorHandler, 
boolean debug) 
throws FileException ( 
try { 
BufferedReader r - 
new BufferedReader( 
new InputStreamReader (new FileInputStream(file), 
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SOURCE _ ENCODING ) ) ; 
return new Parser(r, file.getPath(), loader, errorHandler, debug); 


) 


catch (FileNotFoundException ex) ( 
throw new FileException(ex.getMessage()); 


) 


catch (UnsupportedEncodingException ex) ( 
throw new Error("UTF-8 is not supported??: " + ex.getMessage()); 


) 
} 


上 述 代码 生成 读 取 文件 file 的 FileInputSttream 对 象 , 并 用 InputStreamReader 


fil BufferedReader 将 其 封装 。 
InputStreamReader 的 编码 暂且 定 为 UTF-8。 如 果 能 够 根据 命令 行 选项 等 来 设置 编码 可 


能 更 为 方便 。 
解析 器 的 启动 


parse 方法 的 代码 如 代码 清单 8.22 所 示 。 
代码 清单 8.22 ”Parser#parse 方法 ( parser/Parser.jj ) 




















public AST parse() throws SyntaxException [ 


try { 
return compilation unit(); 


catch (TokenMgrError err) ( 
throw new SyntaxException(err.getMessage()); 


) 


catch (ParseException ex) { 
throw new SyntaxException(ex.getMessage()); 


) 


catch (LookaheadSuccess err) { 
throw new SyntaxException("syntax error"); 


} 
} 


JavaCC 通过 调用 和 需要 解析 的 非 终 端 符 号 同名 的 方法 开始 解析 处 理 ， 即 这 里 通过 调用 
compilation unit 开始 解析 。 

JavaCC 生成 的 解析 器 在 解析 过 程 中 可 能 发 生 的 异常 有 3 种 。 发 生 扫 描 错 误 的 
TokenMgrError、 发 生 解 析 错 误 的 ParseException 和 LookaheadSuccess。cbc 会 捕获 
这 些 异常 并 转换 为 自己 定义 的 SyntaxException 异常 。 

LookaheadSuccess 是 JavaCC 内 部 使 用 的 异常 ， 程 序 员 看 到 后 可 能 会 认为 是 JavaCC 的 
bug， 但 测试 中 确实 会 抛 出 这 个 异常 ， 所 以 姑且 进行 捕获 。 





































































语义 分 析 〈1 ) 
引用 的 消解 


本 章 我 们 来 说 一 下 cbc 的 语义 分 析 的 概要 以 及 变 
量 引用 的 消解 、 类 型 名 称 的 消解 等 话题 。 
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语义 分 析 的 概要 








本 性 将 简单 介绍 一 下 cbe 中 语义 分 析 的 规范 和 实现 。 
[y 本 章 目的 

本 章 将 对 上 一 曹 中 生成 的 抽象 语法 树 的 语义 进行 分 析 ， 并 实施 变量 引用 的 消解 和 类 型 检查 。 
具体 来 说 ， 我 们 要 实施 如 下 这 些 处 理 。 


. 变量 引用 的 消 
型 名 称 的 消解 
M 

















* 





























这 里 简单 地 讲解 一 下 上 述 项 目 。 

“变量 引用 的 消解 ”是 指 确定 具体 指向 哪个 变量 。 例 如 变量 “i” 可 能 是 全 局 变量 i， 也 可 
能 是 静态 变量 i， 还 可 能 是 局 部 变量 i。 通 过 这 个 过 程 来 消除 这 样 的 不 确定 性 ， 确 定 所 引用 的 
到 底 是 哪个 变量 。 

“类 型 名 称 的 消解 ” 即 类 型 的 消解 。 如 第 8 HIR, cbe 的 类 型 名 称 由 TypeRef 对 象 表示 ， 
类 型 由 Type 对 象 表示 。 类 型 名 称 的 消解 就 是 将 TypeRef 对 象 转换 为 Type 对 象 。 

“类 型 定义 检查 ”是 指 检查 是 和 否 存 在 语义 方面 有 问题 的 类 型 定义 。 例 如 void 的 数组 、 含 有 
void 成 员 的 结构 体 、 直 接 将 自身 的 类 型 〈 而 非 通过 指针 ) 作为 成 员 的 结构 体 等 ， 都 是 在 语义 上 
有 问题 的 定义 。 在 此 过 程 中 将 检查 是 否 有 这 样 的 定义 。 

“表达 式 的 有 效 性 检查 ”是 指 检查 是 否 存在 无 法 执行 的 表达 式 。 例 如 1++ 这 样 的 表达 式 可 
以 通过 cbe 的 解析 器 ,但 1 并 非 变 量 ， 所 以 不 能 自 增 。 因 此 这 个 表达 式 实际 上 无 法 执行 ， 属 于 
不 正确 的 表达 式 。 在 此 过 程 中 将 检查 是 否 有 这 样 的 不 正确 的 表达 式 。 

关于 “静态 类 型 检查 ”， 想 必 使 用 C 或 Java 的 各 位 应 该 非常 熟悉 了 。 在 此 过 程 中 将 检查 表 
达 式 的 类 型 , 发 现 类 型 不 正确 的 操作 时 就 会 报错 。 例 如 在 结构 体 之 间 进 行 了 + 运算", 将 int 类 
型 的 值 未 经 转换 直接 赋 给 指针 类 型 的 变量 等 。 




















































































































(D 没有 重 载 过 十 运算 。 TRAD 
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ER 5 个 过 程 的 执行 顺序 有 着 一 定 的 限制 。 首 先 ,“ 类 型 定义 检查 ”在 “类 型 名 称 的 消解 ” 
未 结束 前 不 能 执行 。 其 次 , “表达 式 的 有 效 性 检查 ”在 前 3 个 过 程 结 束 前 不 能 执行 。 最 后 , UHR 
态 类 型 检查 ”在 前 4 个 过 程 都 结束 前 不 能 执行 。 总 结 一 下 上 述 限 制 ， 如 图 9.1 所 示 。 
































1. 变量 引用 的 消解 2. 类 型 名 称 的 消解 














4. 表达 式 的 有 效 性 检 


Y 


图 9.1. 语义 分 析 的 处 理 顺 序 的 限制 


[dj 


抽象 语法 树 的 遍历 


在 语义 分 析 以 及 之 后 的 处 理 中 需要 按 顺序 访问 抽象 语法 树 的 所 有 市 点 。 例 如 ， 在 进行 “ 变 
量 引用 的 消解 ”时 ， 就 要 从 抽象 语法 树 找 出 所 有 变量 的 定义 和 引用 并 进行 关联 。 另 外 ， 在 进行 
“静态 类 型 检查 ”时 ， 要 从 抽象 语法 树 的 叶子 节点 开始 依次 饥 历 各 个 节点 ， 检 查 节 点 所 对 应 的 表 
达 式 的 类 型 。 


一 般 而 言 ， 像 这 样 按 顺 序 访 问 并 处 理 树 形 结构 的 所 有 节点 称 为 树 的 遍 JE 





























Bj (traverse), [8 9:2 是 饥 历 的 示意 图 。 语 义 分 析 中 遍历 抽象 语法 树 是 为 了 AAA NN 

进行 引用 消解 和 类 型 检查 。 (4) *N 
在 遍历 像 抽象 语法 树 这 样 的 由 各 种 类 的 实例 所 组 成 的 树 形 结构 并 进行 DUNS 

各 种 处 理 时 ， 常 用 的 手段 是 利用 设计 模式 中 的 Visitor 模式 。 借 助 Visitor Bi 


式 ， 像 “变量 引用 的 消解 ”和 “静态 类 型 检查 ”这 样 一 连 串 的 处 理 就 能 够 ”图 9.2 树 的 遍历 
合并 到 一 个 类 中 来 描述 。 


不 使 用 Visitor 模式 的 抽象 语法 树 的 处 理 


为 了 理解 Visitor 模式 的 目的 ， 我 们 先 来 思考 一 下 如 何不 使 用 Visitor 模式 进行 静态 类 型 检查 。 

静态 类 型 检查 需要 人 处理 几乎 所 有 的 节点 ， 并 且 不 同 节点 类 的 处 理 代码 各 不 相同 。 例 如 ， 在 
二 元 运算 符 的 节点 (BinaryopNode) 中 ， 要 先 分 别 检查 左右 表达 式 的 类 型 ， 再 检查 左右 表达 
式 的 类 型 是 否 一 致 。 而 如 果 是 函数 调用 的 节点 (FuncallNode )， 则 先 检查 所 有 实 参 的 类 型 ， 
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然后 青 在 此 基础 上 确认 是 否 和 函数 原型 中 规定 的 
的 处 理 完全 不 同 。 

说 起 面向 对 象 语言 中 根据 类 的 不 同 采用 不 同 处 理 的 方法 ， 可 以 考虑 使 用 函数 的 多 态 
( polymorphism )。 像 下 面 这 样 ， 在 各 节点 类 中 定义 检查 各 节点 表示 的 表达 式 类 型 的 方法 ， 通 过 
递归 调用 这 些 方 法 来 进行 类 型 检查 。 


Wr 


数 类 型 一 致 。 像 这 样 ， 不 同 节 点 类 中 所 必需 











class Node { 
// 规定 所 有 节点 类 中 都 必须 定义 checkType 方法 
abstract public void checkType(); 

















) 


class ExprNode extends Node () 


class UnaryOpNode extends ExprNode { 
public void checkType() ( 
expr () .checkType () ; // 检查 使 用 运算 符 的 表达 式 类 型 
// 检查 运算 符 是 否 可 












































) 


class BinaryOpNode extends ExprNode { 








public void checkType() ( 
left().checkType() ; // 检查 左 侧 表达 式 的 类 型 
right () .checkType(); // 检查 右 侧 表达 式 的 类 型 





// 检查 左边 和 右边 的 类 型 是 否 相 符 





} 


class AssignNode extends ExprNode ( 
public void checkType() ( 
lhs ().checkType () ; // 检查 左 侧 表达 式 的 类 型 
rhs().checkType () ; // 检查 右 侧 表达 式 的 类 型 
// 检查 左边 和 右边 的 类 型 是 否 相符 

















在 所 有 节点 类 中 定义 checkType 方法 


像 这 样 ， 只 要 在 各 节点 中 递归 调用 各 子 节 点 的 checkType 方 法 ， 就 能 在 换 历 抽象 语法 树 
的 同时 ， 根 据 不 同 的 节点 类 采取 不 同 的 处 理 。 


基于 Visitor 模式 的 抽象 语法 树 的 处 理 


使 用 多 态 来 遍历 抽象 语法 树 的 逻辑 简单 ， 而 且 容 易 理解 ， 但 代码 就 不 是 那么 易 读 了 。 因 为 
Java 中 通常 以 类 为 单位 来 划分 文件 ， 所 以 类 型 检查 的 代码 会 分 散在 所 有 节点 类 的 文件 中 。 这 样 
一 来 ， 类 型 检查 的 整个 处 理 过 程 是 如 何 串联 起 来 的 就 变 得 难以 理解 。 

这 种 情况 下 Visitor 模式 就 能 派 上 用 场 了 。 使 用 Visitor 模式 能 将 分 散在 各 个 类 中 的 类 型 检查 
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代码 聚合 到 一 个 类 中 。 

Visitor 模式 是 刚才 使 用 多 态 的 代码 的 具体 应 用 。 既 然 问题 在 于 处 理 一 个 问题 的 代码 分 散在 
所 有 的 节点 类 中 ,那么 将 这 些 方法 的 内 容 聚 合 到 单个 类 中 ， 然 后 在 各 节点 类 中 调用 该 方法 即 可 。 
请 结合 图 9.3 了 解 Visitor 模式 的 概况 。 


只 使 用 递归 调用 的 情况 


class UnaryOpNode { 
checkType( { 


检查 UnaryOpNode 的 类 型 的 代码 




















class BinaryOpNode { 
checkType( { 


检查 BinaryOpNode 的 类 型 的 代码 














class AssignNode { 
checkType() { 


检查 AssignNode 的 类 型 的 代码 














class UnaryOpNode { 
checkType( { 
m class TypeChecker { 
调 checkType(UnaryOpNode node) { 



































检查 UnaryOpNode 的 类 型 的 代码 





} 


class BinaryOpNode { 
checkType( { 


调用 


checkType(BinaryOpNode node) f 
检查 BinaryOpNode 的 类 型 的 代码 
































} 


checkType(AssignNode node) { 
检查 AssignNode 的 类 型 的 代码 











class AssignNode { 
checkType( { 




















图 9.3 Visitor 模式 的 概况 
像 图 9.3 中 右 侧 出 现 的 Typecheckez 这 样 的 类 一 般 被 称 为 visitor。 
需要 注意 TypeChecker 类 中 根据 参数 类 型 的 不 同 对 checkType 方法 进行 了 重 载 ， 因 此 


E 





imi 

















140 第 9 章 语义 分 析 ( 1) 引用 的 消解 





无 论 是 检查 哪个 节点 的 方法 ， 都 可 以 命名 为 checkType. 


Vistor 模式 的 一 般 化 


Visitor 模式 的 思考 方式 如 上 例 所 示 ， 但 还 有 少许 可 优化 之 处 。 

图 9.3 所 示 的 做 法 中 最 大 的 问题 在 于 要 在 节点 类 中 添加 大 量 的 代码 ， 而 这 些 代码 仅仅 是 为 
了 调用 visitor 类 的 方法 。 编 译 带 中 一 般 都 会 存在 大 量 表示 市 点 的 类 ， 如 果 类 型 检查 添加 一 个 函 
数 、 变 量 引用 的 消解 添加 一 个 、 类 型 名 称 的 消解 添加 一 个 …… 那 么 仅仅 是 调用 其 他 方法 的 函数 
就 必须 定义 “节点 类 数量 x 操作 种 类 ”个 ， 这 样 太 麻 烦 了 。 我 们 希望 至 少 在 各 个 节点 类 中 能 用 
一 个 方法 来 应 对 所 有 人 处理 。 

Java 中 适用 于 上 述 情况 的 方法 就 是 接口 (interface )。 如 果 我 们 通过 设 定 使 节点 类 方面 不 接 
收 特定 的 visitor 类 (例如 Typechecker 类 )， 而 是 接收 接口 ， 那 么 就 能 只 用 一 个 方法 来 处 理 多 
个 visitor 类 。 

让 我 们 来 看 一 下 cbe 中 基于 上 述 方案 的 Visitor 模式 的 实现 。cbc 中 实现 的 Visitor 模式 的 概 
要 如 下 所 示 。 


class Node { 
// 规定 所 有 节点 类 中 都 必须 定义 accept 方法 
abstract public void accept(ASTVisitor visitor); 

















































































































) 


class ExprNode extends Node {} 


class UnaryOpNode extends ExprNode { 
public void accept(ASTVisitor visitor) 
visitor mabe (en 8 


一 一 


} 
} 


class BinaryOpNode extends ExprNode { 
public void accept(ASTVisitor visitor) 


一 一 


visitor.visit (this); 


class AssignNode extends ExprNode ( 
public void accept(ASTVisitor visitor) 


一 一 


visitor.visit (this); 


) 


intarface ASTVisitor { 
public void visit(UnaryOpNode node); 
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public void visit(BinaryOpNode node); 
public void visit(AssignNode node); 


) 


class TypeChecker implements ASTVisitor { 
public void visit(UnaryOpNode node) ( 
Inodesexpiuaedep RH // 检查 使 用 运算 符 的 表达 式 类 型 
/ / 仿 查 运算 符 是 否 可 















































) 


public void visit(BinaryOpNode node) { 
node.left().accept (this); // 检查 左 侧 表达 式 的 类 型 
node.right().accept(this); // 检查 右 侧 表达 式 的 类 型 
// 检查 左边 和 右边 的 类 型 是 否 相 符 














) 


public void visit(AssignNode node) ( 
node.lhs().accept (this); // 检查 左 侧 表 达 式 的 类 型 
node.rhs().accept (this); // 检查 右 侧 表达 式 的 类 型 
// 检查 左边 和 右边 的 类 型 是 否 相符 














) 


ASTVisitor 是 各 个 visitor 类 的 接口 。TypeChecker 类 通过 实现 ASTVisitor 接口 ， 就 
可 以 从 节点 类 调用 Typechecke 的 方法 。 

ASTVisitor 接口 和 Typechecker 类 中 定义 了 名 为 visit 的 方法 。visit 方法 就 是 图 
9.3 中 的 checkType。 像 图 9.3 中 这 样 直 接 使 用 Typechecker 类 时 ， 方 法 名 checkType 并 
没有 什么 问题 。 但 将 多 个 visitor 类 聚合 到 一 个 接口 的 情况 下 ，checkType 这 样 的 方法 名 就 不 那 
么 合适 了 。 因 为 visitor 类 中 还 会 有 用 于 变量 引用 的 消解 的 类 以 及 用 于 类 型 名 称 的 消解 的 类 ， 用 
名 为 checkType 的 方法 来 处 理 变量 引用 的 消解 ， 怎 么 想 都 觉得 不 合适 。 因 此 采用 了 比较 中 立 
的 方法 名 visit。 

同样 ， 节 点 类 这 边 的 checkType 方法 也 要 修改 名 称 ， 这 里 采用 方法 名 accept 是 Visitor 
模式 的 规定 。 


cbc 中 Visitor 模式 的 实现 


为 了 提高 可 读 性 和 代码 的 通用 性 ，cbc 中 的 Visite 模式 在 之 前 的 基础 上 又 进行 了 3 处 微调 。 

第 一 ， 最 后 出 现 的 代码 node .expr () .accept (this)， 乍 看 之 下 不 知道 用 意 何在 ， 
此 将 node.expr().accept(this) 这 样 的 处 理 封 装 成 check 方法 或 resolve 方法 。 举 一 
个 例子 ， 在 检查 表达 式 的 有 效 性 的 Dereferencechecker HF, check 方法 的 定义 如 代码 清单 
9.1 所 示 。 
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的 消解 


代码 清单 9.1 DereferenceChecker#check ( compiler/DereferenceCherker.java ) 


private void check(StmtNode node) [ 


node.accept (this); 


) 


private void check(ExprNode node) [ 


node.accept (this); 


) 

















通过 使 用 上 述 方法 ， 在 visitor 类 中 人 处 理 节点 时 ， 只 需要 写成 check (node .expr()) 或 


resolve (node .expr) 就 可 以 了 ， 和 最 初 使 用 递归 调用 的 代码 看 上 去 很 接近 。 
第 二 ， 导 入 了 Visitor 类 作为 负责 语义 分 析 的 visitor 类 群 的 基 类 。Visitor 类 提供 了 “遍历 所 
有 节点 ， 但 不 进行 任何 处 理 ” 的 代码 。 通 过 导入 Visitor 类 ， 在 子 类 中 只 需 为 需要 额外 进行 处 理 


的 节点 类 重 写 visit 方法 即 可 。 

















第 三 ， 利 用 Java5 的 generics 机 制 ， 使 得 visit 方法 能 够 返回 任意 的 返回 值 。 例 如 通过 
实现 ( implements ) ASTVisitor 接口 ， 就 可 以 声明 处 理 StmtNode 的 visit 方法 返回 
Void， 处 理 ExprNode 的 visit 方法 返回 Expro 








class IRGenerator implements ASTVisitor«Void, Expr> 


其 实 语 义 分 析 的 visitor 类 群 不 需要 返回 值 ， 所 以 可 以 都 写成 <void,Void>。 只 有 
IRGenerator 类 返回 void 以 外 的 值 。 

随便 提 一 下 ，Void 类 不 同 于 void 类 型 ， 所 以 即使 声明 为 void, visit 方法 也 必须 返回 
一 定 的 值 。cbc 不 得 已 ( 暂时 ) 使 用 了 所 有 方法 都 以 return null 结束 这 样 的 解决 方法 。 


语义 分 析 相关 的 cbc 的 类 








在 本 节 最 后 ， 我 们 将 和 语义 分 析 相 关 的 cbe 的 类 列举 在 表 9.1 中 。 除 TypeTable 之 外 ,其 





余 都 是 visitor 类 的 子 类 。 


表 9.1 和 语义 分 析 相 关 的 类 




















类 作用 

LocalResolver 变量 引用 的 消解 
DereferenceChecker 表达 式 的 有 效 性 检查 
TypeResolver 类 型 名 称 的 消解 
TypeChecker 静态 类 型 检查 
TypeTable 类 型 定义 检查 














从 下 一 方 开始 我 们 将 深入 了 解 各 个 类 的 处 理 内 容 。 
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Oo 
乡 更 轻松 的 Visitor 模式 的 实现 




















本 节 我 们 介绍 了 Visitor 模式 以 及 它 的 具体 实现 ， 说 实话 这 样 的 实现 还 是 过 于 繁琐 。 在 各 个 节点 
中 一 一 定义 完全 一 样 的 accept 方法 就 已 经 够 麻烦 的 了 ， 而 且 node.accept (this) 从 代码 的 字面 
上 看 也 完全 不 知道 是 什么 意思 。 

即便 如 此 ， 说 起 基于 Java 的 抽象 语法 树 ， 本 节 所 介绍 的 实现 也 属于 比较 常规 的 做 法 ， 因 此 即 
便 觉得 麻烦 也 只 能 姑且 这 么 做 。 但 如 果 cbc 并 非 书 籍 中 的 示例 代码 ， 笔 者 会 选用 其 他 的 方式 来 实现 
Visitor 模式 ， 那 就 是 反射 。 

反射 (reflection ) 是 在 运行 时 获取 或 修改 程序 自身 信息 的 功能 。 对 Java 来 说 ， 利 用 反射 可 以 
通过 字符 串 来 指定 调用 的 函数 ， 同 样 还 可 以 通过 字符 串 来 指定 需要 获取 的 属性 的 值 。 

Visitor 模式 的 关键 在 于 只 需要 编写 check (node), ， 根 据 实际 的 node 类 来 调用 相应 的 方法 。 
如 果 只 是 这 样 的 话 ， 利 用 多 态 的 确 非 常 简 单 ， 因 为 Visitor 模式 需要 在 单个 类 中 使 用 多 态 。 但 在 编 
译 时 只 知道 node 的 类 是 ExprNode 或 者 StmtNode， 因 此 需要 本 节 中 所 介绍 的 这 样 稍 显 繁琐 的 
机 制 。 
但 是 ， 即 使 在 编译 时 不 知道 是 什么 类 ， 在 运行 时 就 也 能 知道 了 。 然 后 利用 反射 就 能 在 运行 时 根 
据 类 调用 不 同 的 方法 。 本 书 中 提供 了 使 用 反射 实现 Visitor 模式 的 示例 代码 ， 感 兴趣 的 读者 可 以 去 看 
= Fe 
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语义 分 析 (1) 引 


























变 


引用 的 消解 





本 节 将 对 变量 引用 的 消解 ， 即 确定 具体 指向 哪 


问题 概要 


(定义 ) 的 处 理 进行 实现 。 





CHA (Ch) 中 的 变量 有 作用 域 的 概念 ， 因 此 仅 看 变量 名 无 法 马上 知道 该 变量 和 哪个 变 





量 定 义 是 相关 联 的 。 例 如 单 





来 ,这样 的 处 理 称 为 


“变量 引 月 

















”"， 可 能 是 全 局 变量 ， 也 可 能 是 函数 静态 变量 ， 还 可 能 
是 本 地 的 临时 变量 。 为 了 消除 这 样 的 不 确定 性 ， 我 们 需要 将 所 有 的 变量 和 它们 的 定义 关联 起 
的 消解 "。 具 体 来 说 ， 就 是 为 抽象 语法 树 中 所 有 表示 引用 变量 的 


VariableNode 对 象 添加 该 变量 的 定义 (Variable 对 象 ) 的 信息 。 
另外 ， 卫 数 名 也 属于 变量 的 一 种 。C 语言 或 Cb 中 的 表达 式 puts ("string") 的 含义 是 
“调用 变量 puts 所 指向 的 函数 ”"， 因 此 只 要 确定 了 变量 puts 所 指向 的 对 象 ， 需 要 调用 的 函数 





也 就 确定 了 。 


实现 的 概要 











变量 引用 的 消解 由 名 为 LocalResolver 的 类 负责 。 程 序 中 将 名 称 和 其 对 应 的 对 象 进行 关 
联 的 处 理 称 为 消解 (resolve )， 因 此 这 里 将 负责 该 处 理 的 类 命名 为 LocalResolver。 





为 了 管理 变量 的 作 上 月 
如 表 9.2 所 示 。 
表 9.2 Scope 及 其 子 类 的 作用 





日 域 ，LocalResolver 类 使 月 








HT Scope 类 以 及 其 子 类 。 这 些 类 的 作用 






































类 名 
Scope < 作 
ToplevelScope 示 程 局 变量 


























LocalScope 


任何 程序 都 存在 一 个 ToplevelScope 对 象 ， 并 且 该 对 








示 一 个 临时 变量 的 




















寺 变 量 








象 位 于 树 的 顶层 。Toplevelscope 





对 象 的 下 面 有 着 和 定义 的 因数 数量 相同 的 DocalScope 对 象 。LocalScope 对 象 下 面 连接 着 


由 任意 数量 的 LocalScope 对 象 所 组 成 的 树 。 
作用 域 最 终 形成 的 树 形 结构 如 图 9.4 所 示 。 

















92 ”变量 引用 的 消解 | 145 














图 9.4 Scope 对 象 的 树 
只 要 生成 了 这 样 的 树 ， 查 找 变 量 的 定义 就 非常 简单 了 。 只 要 从 引用 了 变量 的 作用 域 
开始 ， 沿 着 树 咎 上 查找 变量 名 ， 最 先 找 到 的 变量 定义 就 是 要 找 的 目标 。 如 果 向 上 追溯 到 
ToplevelScope 还 没有 找到 变量 所 对 应 的 定义 ， 即 使 用 了 未 定义 的 变量 ， 就 会 报错 。 
LocalResolver 类 利用 栈 (stack) 一 边 生 成 Scope 对 象 的 树 一 边 进 行 变 量 引用 的 消解 。 


Scope 树 的 结构 


Scope 对 象 树 是 LocalResolver 实现 中 最 重要 的 部 分 ， 因 此 让 我 们 稍微 详细 地 来 看 一 下 。 
首先 ， 各 个 类 的 属性 的 定义 如 下 所 示 。 






LocalScope 





























abstract public class Scope ( 
protected List«LocalScope» children; 
) 


public class ToplevelScope extends Scope { 
protected Map«String, Entity» entities; 
protected List«DefinedVariable» staticLocalVariables; // cache 


) 


public class LocalScope extends Scope { 
protected Scope parent; 
protected Map«String, DefinedVariable» variables; 


首先 要 注意 的 是 所 有 Scope 对 象 都 可 以 用 LocalScope 链表 的 形式 来 保存 子 作用 域 。 并 
H LocalScope 对 象 拥有 parent 属性 ， 可 以 追溯 父亲 的 Scope 对 象 。 即 Scope 对 象 的 树 可 
以 从 父 节点 向 下 查找 到 子 节点 ， 也 可 以 从 子 节点 追溯 到 父 节 点 。 

ToplevelScope 类 和 LocalSscope 类 分 别 定 义 了 Map 类 型 的 属性 entities 和 
variables。 这 里 的 entities 和 variables 都 是 保存 变量 和 函数 的 定义 的 对 象 。 
ToplevelScope 的 entities 中 保存 着 所 有 顶层 的 定义 。Map 的 键 是 变量 名 ， 值 是 Entity 
对 象 (变量 或 函数 的 定义 ) LocalScope 的 variables 中 保存 着 所 有 的 临时 变量 ，Map 的 
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键 是 变量 名 ， 值 是 DefinedqVariable 对 象 。 

entities fl variables 本 身 都 是 LinkedHashMap 的 对 象 ， 即 有 序 的 散 列 表 。 因 为 在 
处 理 函 数 或 变量 时 ， 按 照 代 码 的 先后 顺序 输出 消息 这 种 方式 对 编译 器 的 用 户 来 说 更 为 友好 ， 所 
以 保留 了 顺序 信息 。 
像 Scope 这 样 管理 变量 和 函数 名 称 列表 的 类 一 般 称 为 符号 表 (symbol table )。 


LocalResolver 类 的 属性 


接着 让 我 们 来 看 一 下 LocalResolver 类 的 构造 函数 和 和 人口 。LocalResolver 类 的 构造 
函数 如 代码 清单 9.2 所 示 。 


代码 清单 9.2 ”LocalResolver 类 的 构造 函数 ( compiler/LocalResolver.java ) 





















































private final LinkedList«Scope» scopeStack; 
private final ConstantTable constantTable; 
private final ErrorHandler errorHandler; 


public LocalResolver(ErrorHandler h) { 
this.errorHandler - h; 
this.scopeStack = new LinkedList«Scope»(); 
this.constantTable - new ConstantTable(); 


} 

构造 函数 中 设置 了 3 个 属性 

首先 ，ErrorHandler 类 是 cbe 整体 所 使 用 的 用 于 处 理 错误 的 类 ， 具 有 隐藏 错误 消息 输出 
目标 的 功能 。 

scopeStack 属性 中 保存 的 是 表示 Scope 般 套 关系 的 栈 。 这 里 栈 的 实体 是 LinkedList 
对 象 ，LinkedList 也 可 以 作为 栈 来 使 用 。 

ConstantTable 是 cbe 中 用 于 管理 字符 串 常量 的 类 。 字 符 串 常量 用 ConstantEntry 对 
象 表 示 ，ConstantTable 对 象 的 功能 就 是 统一 管理 ConstantEntry 对 象 。 


LocalResolver 类 的 启动 


我 们 继续 来 看 LocalResolver 类 的 入 口 ( 处 理 开始 的 地 方 ) 
如 代码 清单 9.3 所 示 。 
代码 列表 9.3 LocalResolver#resolve(AST) ( compiler/LocalResolver.java ) 





T 





o 
































resolve 方法 的 代码 ， 


throws SemanticException { 
new ToplevelScope(); 


public void resolve(AST ast) 
ToplevelScope toplevel - 
scopeStack.add (toplevel); 


for (Entity decl : ast.declarations()) { 
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toplevel.declareEntity (decl); 


) 


for (Entity ent : ast.definitions()) { 
toplevel.defineEntity (ent); 


) 


resolveGvarInitializers (ast.definedVariables()); 
resolveConstantValues (ast.constants()); 
resolveFunctions (ast.definedFunctions()); 
toplevel.checkReferences (errorHandler); 
if (errorHandler.errorOccured()) { 

throw new SemanticException("compile failed."); 


) 


ast.setScope (toplevel); 
ast.setConstantTable (constantTable); 


} 

resolve 方 法 可 以 分 为 3 个 部 分 : 第 1 部 分 ( 空 行 前 ) 将 实例 的 属性 初始 化 ; 中 间 部 分 进 
行 实际 的 处 理 ; 最 后 部 分 保存 AST 信息 。 

先 讲解 一 下 第 1 部 分 和 最 后 部 分 。 

第 1 部 分 先生 成 ToplevelScope 对 象 ， 然 后 将 生成 的 ToplevelScope 对 象 用 
scopeStack.add (toplevel) 添加 到 scopeStack。 这 样 栈 里 面 就 有 了 1 个 Scope 对 象 。 

在 最 后 部 分 中 ， 将 在 此 类 中 生成 的 ToplevelScope 对 象 和 ConstantTable 对 象 保存 到 
AST 对 象 中 。 这 两 个 对 象 在 生成 代码 时 会 用 到 ， 为 了 将 信息 传 给 下 一 阶段 ， 所 以 保存 到 AST 对 
象 中 。 


FJ 变量 定义 的 添加 


下 面 讲 一 下 resolve -方法 中 的 主要 处 理 。 
先 从 下 面 这 部 分 代码 看 起 。 


for (Entity decl : ast.declarations()) [ 
toplevel.declareEntity (decl); 


























) 


for (Entity ent : ast.definitions()) ( 
toplevel.defineEntity (ent); 


) 
这 两 个 foreach it] pde 48 JS EdE. BRUIT USUS ToplevelScope 中。 第 1 
个 foreach 语句 添加 导入 文件 (* .hb ) 中 声明 的 外 部 变量 和 函数 ， 第 2 个 foreach 语句 用 于 导 
入 所 编译 文件 中 定义 的 变量 和 函数 。 两 者 都 是 调用 ToplevelScope#declareEntity 人 往 
ToplevelScope 对 象 中 添加 定义 或 声明 。 
ToplevelScope#declareEntity 的 内 容 如 代码 清单 9.4 所 示 。 














ivi 
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代码 清单 9.4 ToplevelScope#declareEntity ( entity/ToplevelScope.java ) 


public void declareEntity(Entity entity) throws SemanticException { 
Entity e - entities.get(entity.name()); 
if (e != null) { 


throw new SemanticException("duplicated declaration: "+ 
entity.name() + ": " + 
e.location() + " and " + entity.location()); 
entities.put(entity.name(), entity); 


) 





如 果 entities.get (entity.name ()) 返回 null 以 外 的 值 ， 就 意味 着 已 经 定义 了 和 将 
要 添加 的 变量 、 椰 数 同名 的 变量 、 函 数 ， 因 此 抛 出 SemanticException 异常 。 检 查 通过 的 
话 则 调用 entities.put 来 添加 变量 、 孙 数 。 


函数 定义 的 处 理 


回 到 LocalResolver 类 的 resolve 方法 ， 让 我 们 看 一 下 下 面 3 行 处 理 。 














resolveGvarInitializers(ast.definedVariables()); 
resolveConstantValues (ast.constants()); 
resolveFunctions (ast.definedFunctions()); 








resolveGvarInitializers 和 resolveConstants 只 是 分 别 遍历 全 局 变量 和 常量 的 


初始 化 表达 式 。resolveFunctions 是 最 重要 的 ， 因 此 我 们 来 看 一 下 它 的 内 部 实现 ( 代码 清 
单 9.5 )。 
代码 清单 9.5 LocalResolver£&resolveFunctions ( compiler/LocalResolver.java ) 


private void resolveFunctions (List«DefinedFunction» funcs) { 
for (DefinedFunction func : funcs) { 
pushScope (func.parameters()); 
resolve(func.body()); 
func.setScope (popScope ()); 


) 
对 文件 中 定义 的 所 有 函数 依次 重复 如 下 处 理 。 
























































1. 调用 pushScope 方法 ， 生 成 包含 函数 形 参 的 作用 域 ， 并 将 作用 域 压 到 栈 ( scopestack ) 中 
2. 用 resolve (func.body 0) 方法 来 遍历 函数 自身 的 语法 树 

3. 调用 popSscope 方法 弹出 刚才 压 入 栈 的 Scope 对 象 ， 将 该 Scope 对 象 用 func .setScope 
AS DU E cep 


pushScope fll popScope 这 样 的 方法 都 是 第 一 次 出 现 ， 下 面 我 们 来 看 一 下 它们 的 实现 。 
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pushScope 方法 


pushScope 方法 是 将 新 的 LocalScope 对 象 压 人 作用 域 栈 的 方法 ， 基 内容 如 代码 清单 9.6 
所 示 。 


代码 清单 9.6 LocalResolver#pushScope ( compiler/LocalResolver.java ) 





private void pushScope (List<? extends DefinedVariable> vars) { 
LocalScope scope = new LocalScope (currentScope()); 
for (DefinedVariable var : vars) { 





if (scope.isDefinedLocally (var.name())) { 
error(var.location(), 
"duplicated variable in scope: " + var.name()); 
) 
else ( 


Scope.defineVariable (var); 


} 
} 


ScopeStack.addLast (scope); 
} 
一 开始 的 new LocalScope (currentScope ()) 生成 以 currentScope() 为 父 作 用 域 
的 LocalScope 对 象 。currentScope 是 返回 当前 栈 顶 的 Scope 对 象 的 方法 。 换 言 之 ， 在 当 
前 遍历 到 的 表达 式 所 在 之 处 ， 表 示 最 内 侧 作用 域 的 Scope 对 象 就 是 currentscope 方法 返回 
的 内 容 。 
接着 用 foreach 语句 将 变量 vars 添加 到 LocalScope 对 象 中 。 也 就 是 说 ， 向 LocalScope 
对 象 添加 在 这 个 作用 域 上 所 定义 的 变量 。 特 别 是 在 函数 最 上 层 的 LocalScope 中 ， 要 添加 形 参 
的 定义 。 
在 添加 变量 时 ， 先 用 scope .isDefinedLocally 方法 检查 是 否 已 经 定义 了 同名 的 变量 ， 
然后 再 进行 添加 。 向 LocalScope 对 和 象 添加 变量 时 使 用 defineVariable 方法 。 
最 后 通过 调用 scopestack.addLast (scope) 将 生成 的 Localscope 对 象 压 到 作用 域 
的 栈 项 。 这 样 就 能 表示 作用 域 的 垦 套 了 。 
另外 ， 注 意 在 检查 同名 的 变量 定义 时 要 避免 抛 出 异常 。 在 负责 语义 分 析 的 Visitor 类 内 
部 ， 要 尽 可 能 地 避免 抛 出 异常 ， 继 续 向 前 处 理 ， 然 后 在 Visitor 类 所 有 的 处 理 结束 后 再 一 起 
抛 出 异常 。 这 样 能 够 在 一 次 编译 中 尽 可 能 多 地 发 现 语 义 上 的 错误 。 


currentScope 方法 


currentScope 是 返回 表示 当前 遍历 到 的 表达 式 所 在 之 处 最 内 层 作 用 域 的 Scope 对 象 的 
方法 ， 如 代码 清单 9.7 所 示 。 
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代码 清单 9.7 LocalResolver#currentScope ( compiler/LocalResolver.java ) 


private Scope currentScope() { 
return scopeStack.getLast(); 


) 
可 见 ， 实 现 非 常 简单 ,用 getLast 方法 取得 作用 域 栈 顶 的 Scope 对 象 并 返回 。 


popScope 方法 


popScope 是 将 最 新 的 LocalScope 对 象 ( currentScope () ) 从 作用 域 的 栈 中 弹出 的 
方法 ， 如 代码 清单 9.8 所 示 。 


代码 清单 9.8 LocalResolver#popScope ( compiler/LocalResolver.java ) 














private LocalScope popScope() ( 
return (LocalScope)scopeStack.removeLast(); 


) 





popScope 方 法 的 实现 也 非常 简单 ， 仅 仅 是 调用 LinkedList 类 的 removeLast 方法 将 
栈 顶 的 对 象 弹出 栈 ， 转 换 为 LocalScope 后 返回 。currentScope 方法 仅仅 是 “取得 ”对 象 ， 
而 popScope 方法 则 是 将 对 象 “弹出 栈 "， 这 是 它们 的 不 同 之 处 。 


添加 临时 作用 域 


程序 的 顶层 除了 郴 数 之 外 ，C 语言 (Cb ) 中 的 程序 块 ({...}block) 也 会 引入 新 的 变量 
作用 域 。 我 们 来 试 着 看 一 下 表示 程序 块 的 BlockNode 类 的 处 理 代 码 。 处 理 BlockNodae 的 方 
法 的 实现 如 代码 清单 9.9 所 示 。 


代码 清单 9.9 LocalResolver#visit ( BlockNode ) ( compiler/LocalResolver.java ) 




















public Void visit (BlockNode node) { 
pushScope (node.variables()); 
Ssuper.visit (node); 
node.setScope (popScope ()) ; 
return null; 


} 
首先 调用 pushscope 方法 ， 生 成 存储 着 这 个 作用 域 上 定义 的 变量 的 Scope 对 象 ， 然 后 压 
人 作用 域 栈 。 
接着 执行 super .visit (node) ;， 执 行 在 基 类 Visitozr 中 定义 的 处 理 ， 即 对 程序 块 的 
代码 进行 遍历 。 
最 后 用 popScope 方法 弹出 栈 顶 的 Scope 对 象 ， 调 用 BlockNode 对 象 的 setscope 方 
法 来 保存 节点 所 对 应 的 Scope IZ. 
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FJ Æx VariableNode 和 变量 定义 的 关联 

使 用 之 前 的 代码 已 经 顺利 生成 了 scope 对 象 的 树 ， 下 面 只 要 实现 树 的 查找 以 及 引用 消解 的 
代码 就 可 以 了 。 

处 理 变量 节点 (VariableNode ) 的 代码 如 代码 清单 9.10 所 示 。 


代码 清单 9.10 LocalResolver#visit(VariableNode) ( compiler/LocalResolver.java ) 








public Void visit(VariableNode node) { 

try { 
Entity ent = currentScope().get (node.name()); 
ent.refered(); 
node.setEntity (ent); 

} 

catch (SemanticException ex) { 
error(node, ex.getMessage()); 

} 


return null; 


) 





75H] currentScope () .get 在 当前 的 作用 域 中 查找 变量 的 定义 。currentscope() 返 
回 的 是 Scope 对象， 所 以 可 以 直接 调用 Scope 类 的 get 方法 。get 方法 的 实现 将 在 稍 后 叙述 。 

取得 定义 后 ， 通 过 调用 ent. refered O0 来 记录 定义 的 引用 信息 ， 这 样 当 变量 没有 被 用 到 
时 就 能 够 给 出 警告 。 

还 要 用 node.setEntity (ent) 将 定义 保存 到 变量 节点 中 ， 以 便 随 时 能 够 从 VariableNode 
取得 变量 的 定义 。 
如 果 找 不 到 变量 的 定义 ，curtzentScope () .get 会 抛 出 SemanticException 异常 ， 
各 其 捕捉 后 输出 到 错误 消息 中 。 


FJ 从 作用 域 树 取得 变量 定义 

最 后 让 我 们 来 看 一 下 LocalScope 类 的 get 方法 的 实现 。LocalScope#get 是 从 作用 域 
树 获取 变量 定义 的 方法 。 它 的 实现 如 代码 清单 9.11 所 示 。 
代码 清单 9.11 LocalScope#get ( entity/LocalScope.java ) 





























A 








public Entity get(String name) throws SemanticException { 
DefinedVariable var - variables.get (name); 
if (var !- null) { 
return var; 
} 
else { 
return parent.get (name); 


) 
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首先 调用 variables.get 在 符号 表 中 查找 名 为 name 的 变量 ， 如 果 找 到 的 话 就 返回 
该 变量 ， 找 不 到 的 话 则 调用 父 作 用 域 (parent) 的 get 方法 继续 查找 。 如 果 父 作用 域 是 
LocalScope 对 象 ， 则 调用 相同 的 方法 进行 递归 查找 。 

另 一 方面 ， 如 果 父 作用 域 是 Toplevelscope 的 话 ， 执 行 代码 清单 9.12 中 的 代码 。 
代码 清单 9.12 ToplevelScope#get ( entity/ToplevelScope.java ) 








public Entity get (String name) throws SemanticException { 


} 





Entity ent = entities.get (name); 
if (ent -- null) { 
throw new SemanticException("unresolved reference: " + name); 


) 


return ent; 


如 果 在 ToplevelSscope 通 过 查找 entities 找 不 到 变量 的 定义 ， 就 会 抛 出 
SemanticException 异常 ， 因 为 已 经 没有 更 上 层 的 作用 域 了 。 

至 此 为 止 变量 引用 的 消解 处 理 就 结束 了 ， 上 述 处 理 生 成 了 以 ToplevelScope 为 根 节点 的 
Scope 对 象 的 树 ， 并 日 将 所 有 VariableNode 和 其 定义 关联 起 来 了 。 








全 局 变量 的 前 向 引用 


ac^ o 


^ 














LocalResolver 类 在 处 理 一 开始 就 导入 所 有 的 全 局 变量 ， 这 样 文件 内 的 所 有 函数 就 都 可 以 使 
用 文件 中 全 部 的 全 局 变量 。 也 就 是 说 ， 在 Ch 中， 使 用 全 局 变量 的 代码 可 以 出 现在 定义 之 前 。 这 是 


































































































其 不同 于 C 语言 之 处 。 最 近 在 定义 之 前 就 可 以 使 用 变量 的 语言 逐渐 增多 ，Cb 在 这 方面 也 不 甘 落后 。 


















































顺便 提 一 下 ， 和 C 语言 一 样 ， 为 了 只 让 在 引用 之 前 定义 的 变量 有 效 ，Cb 中 采用 了 在 定义 的 同 




























































































时 进行 变量 引用 的 消解 的 实现 方式 。 可 能 听 上 去 比较 复杂 ， 但 实际 上 只 需 在 语法 分 析 过 程 中 同时 处 
理 定义 和 引用 消解 就 可 以 了 。C 语言 的 这 个 规范 大 概 是 为 了 易于 实现 而 制定 的 ( 副 作 
要 受苦 了 )。 

















就 是 程序 员 
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类 型 名 称 的 消解 








本 节 将 处 理 从 TypeRef (类 型 名 称 ) 到 Type (类 型 对 象 ) 的 转换 。 


FJ 问题 概要 

cbe 中 类 型 名 称 (TypeReE 对 象 ) 和 实体 (Type 对象 ) 是 分 开 处 理 的 。 到 现在 为 止 ， 所 
有 类 型 都 是 作为 TypeRef 对 象 进行 处 理 的 ， 在 生成 代码 之 前 必须 全 部 转换 为 Type 对 象 。 本 市 
就 将 处 理 上 述 内 容 。 上 一 节 中 将 变量 的 名 称 和 实体 进行 了 关联 (消解 )， 这 里 将 类 型 的 名 称 和 实 
体 进 行 关 联 ( 消解 )。 


实现 的 概要 


负责 将 TypeRe£ 对 象 转换 为 Type 对 象 的 是 TypeResolverZÉ, TypeResolver 类 也 
Æ Visitor 类 的 一 种 ， 所 以 能 够 遍历 抽象 语法 树 。 

TypeResolver 类 的 处 理 仅仅 是 遍历 抽象 语法 树 ， 发 现 TypeRef 的 话 就 从 叶子 市 点 开始 
将 其 转换 为 Type 类 型 。 类 型 和 变量 的 不 同 之 处 在 于 没有 作用 域 的 能 套 (作用 域 唯一 )， 因 此 没 
有 必要 使 用 栈 。 

TypeRef 对 象 和 Type 对 象 的 对 应 关系 保存 在 TypeTable XAP, 












































TypeResolver 类 的 属性 


让 我 们 从 构造 函数 开始 依次 看 一 下 TypeResolverZ2S$, TypeResolver 类 的 构造 函数 如 
代码 清单 9.13 所 示 。 
代码 清单 9.13 TypeResolver 的 构造 函数 ( compiler/TypeResolver.java ) 





private final TypeTable typeTable; 
private final ErrorHandler errorHandler; 


public TypeResolver(TypeTable typeTable, ErrorHandler errorHandler) { 
this.typeTable - typeTable; 
this.errorHandler - errorHandler; 











154 | 第 9 章 语义 分 析 (1) 引用 的 消解 











上 述 构造 函数 将 用 于 处 理 错误 消息 的 ErrorHandler 对 象 以 及 TypeTable 对 象 设置 到 类 
的 属性 中 。TypeTable 是 保存 TypeRef 和 Type 对 应 关系 的 对 象 ， 因 此 TypeResolver 类 
将 围绕 TypeTable 进行 处 理 。 


TypeResolver 类 的 启动 


接着 来 看 一 下 TypeResolver 类 的 人 口 ----resolve 方法 。resolve 方法 的 代码 如 代码 
清单 9.14 所 示 。 


代码 清单 9.14 TypeResolver#resolve ( compiler/TypeResolver.java ) 











public void resolve(AST ast) { 
defineTypes (ast.types()); 
for (TypeDefinition t : ast.types()) ( 
t.accept(this); 


) 


for (Entity e : ast.entities()) ( 
e.accept (this); 
} 
} 
首先 调用 defineTypes 方 法 ， 根 据 代 人 码 中 定义 的 类 型 生成 Type 对 象 ， 并 保存 到 
TypeTable 对 象 中 。 通 过 import 导入 的 类 型 定义 也 在 这 里 处 理 。 
但 defineTypes 方法 不 处 理 结构 体 成 员 的 类 型 等 TypeRef 对 象 。 将 抽象 语法 树 中 已 有 
的 TypeRef 转换 成 Type 的 处 理 将 在 下 面 的 foreach 语句 中 执行 。 如 果 这 两 部 分 处 理 不 分 开 进 
行 的 话 ， 在 处 理 递归 的 类 型 定义 时 程序 会 陷入 死 循环 。 
第 2 个 foreach 语句 将 使 用 import 从 文件 外 部 读 入 的 定义 、 全 局 变量 以 及 函数 等 所 有 剩余 
的 TypeReE 转换 为 Type. 
类 型 名 不 同 于 变量 ， 不 存在 作用 域 的 嵌 套 ， 所 以 无 需 使 用 栈 ， 处 理 也 简单 得 多 。 


类 型 的 声明 


下 面 讲 解 一 下 defineTypes 的 具体 处 理 。defineTypes 是 将 类 型 定义 添加 到 
TypeTable 对 象 的 方法 ， 其 代码 如 代码 清单 9.15 所 示 。 
代码 清单 9.15 TypeResolver#defineTypes ( compiler/TypeResolver.java ) 






































private void defineTypes(List«TypeDefinition» deftypes) { 
for (TypeDefinition def : deftypes) { 


if (typeTable.isDefined(def.typeRef ())) { 

error(def, "duplicated type definition: " + def.typeRef()); 
) 
else ( 


typeTable.put(def.typeRef(), def.definingType()); 
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) 


使 用 foreach 语 句 将 deftypes 中 的 TypeDefinition 对象 逐个 取出 ， 将 def. 
typeRef() 和 def.definingType() 关联 成 对 ， 用 typeTable.put 方 法 添加 到 
typeTable 中 。def .typeRef () 返回 的 是 该 TypeDefinition 对 象 要 定义 的 类 型 的 
TypeRef (类 型 名 称 ) def .definingType () 返回 的 是 该 TypeDefinition 对 象 要 定义 的 
Type (类 型 )。 

但 如 果 typeTable.isDefined() X true it, 说 明 这 个 TypeRef 已 经 存在 ， 这 种 情 
况 下 取消 添加 处 理 并 输出 错误 消息 。 

TypeDefinition 类 是 抽象 类 ， 实际 生成 的 实例 是 TypeDefinition 的 子 类 
structNode、UnionNode、TypedefNode。StructNode 表示 结构 体 的 定义 ，UnionNode 
表示 联合 体 的 定义 ，TypedefNode 表示 typedef 语句 。 

这 里 看 一 个 实现 aefiningType 方 法 的 示例 ，StructNode 的 definingType 方法 的 代 
码 如 代码 清单 9.16 所 示 。 
代码 清单 9.16 StructNode#definingType ( ast/StructNode.java ) 











public Type definingType() { 
return new StructType(name(), members(), location()); 


) 














name () 返回 类 型 的 名 称 (String 对 象 )。 members () 返回 类 型 名 称 和 TypeReE 配对 
(pair ) 的 Slot 对 象 的 列表 。1location() 返回 表示 定义 所 在 位 置 的 Location 对 象 。 根 据 这 
3 个 参数 生成 新 类 型 的 scructType 并 返回 。 

然后 在 TypeResolver 类 中 调用 TypeTable#put 方法 将 生成 的 strcutType 对 
象 添加 到 TypeTable 对 象 中 。TypeTable 对 象 的 内 部 保存 有 HashMap 对 象 ， 因 此 
TypeTable#put 方法 只 需 简 单 地 调用 HashMap#put 即 可 。 


类 型 和 抽象 语法 树 的 遍历 
继续 看 resolve 方法 中 剩余 的 处 理 。 























for (TypeDefinition t : ast.types()) ( 
p cecoep camo 
) 


for (Entity e : ast.entities()) ( 
e.accept (this); 


) 
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上 述 代 人 码 遍 历 在 源 文件 内 外 定义 的 所 有 类 型 、 变 量 、 函 数 ， 将 其 中 所 包含 的 TypeRef 对 象 
全 部 转换 为 Type 对 象 。ast 中 各 方法 的 含义 如 表 9.3 所 示 。 
表 9.3 AST 中 各 方法 的 含义 

















方法 含义 
ast.types() 源 文件 内 外 的 类 型 定义 
ast.entities() import 导入 的 变量 和 函数 的 声明 ， 以 及 源 文 件 内 的 变量 和 函数 的 定义 


























变量 定义 的 类 型 消解 


如 果 遍 历 过 程 中 发 现 TypeRef 对 象 ， 必 须 将 其 转换 为 Type 对 象 。 抽 象 语法 树 中 存在 
TypeRef 对 象 的 节点 如 表 9.4 Bros o 


表 9.4 存在 TypeRef 对 象 的 节点 








































































































节点 类 名 节点 对 应 的 语句 

StructNode 结构 体 定 义 

UnionNode 联合 体 定 义 

TypedefNode typedef 

DefinedVariable 变量 定义 

UndefinedVariable 变量 声明 ( 导入 文件 内 的 变量 ) 
DefinedFunction 函数 定义 

UndefinedFunction 函数 声明 ( 导入 文件 内 的 函数 ) 
CastNode 类 型 转换 

IntegerLiteralNode 整数 字面 

StringLiteralNode 字符 串 字 面 



































ES 
无 论 哪个 节点 ， 处 理 内 容 都 大 同 小 异 ， 这 里 我 们 专门 看 一 下 DefinedVariable 类 和 
Definedfunction 类 的 处 理 。 
首先 ， 人 处理 De£finedVariable 类 的 代码 如 代码 清单 9.17 所 示 。 


代码 清单 9.17 TypeResolver#visit(DefinedVariable) ( compiler/TypeResolver.java ) 


public Void visit (DefinedVariable var) { 
bindType (var.typeNode()); 
if (var.hasInitializer()) { 
visitExpr(var.initializer()); 
} 
return null; 


} 





TypeRef 对 象 基 本 上 都 存放 在 TypeNode 对 象 中 。TypeNode 是 成 对 地 保存 TypeRef 和 
Type 的 对 象 ， 其 日 的 在 于 简化 TypeResolver 类 的 代码 。 
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bindType 方法 的 处 理 内 容 如 代码 清单 9.18 所 示 。 
代码 清单 9.18 TypeResolver#bindType ( compiler/TypeResolver.java ) 





private void bindType (TypeNode n) { 
if (n.isResolved()) return; 
n.setType (typeTable.get (n.typeRef())); 


) 








首先 ， 用 TypeNode#isResolved 方 法 检查 是 否 已 经 完成 了 转换 ， 如 果 已 经 完成 ， 则 即 
AMEH return 结束 处 理 。 如 果 还 未 转换 ， 用 n.typeRef () 从 TypeNode 中 取出 TypeRef， 
再 用 typeTable.get 转换 为 Type 对 象 ， 然 后 将 此 Type X 2: Hi n.setType 设置 到 
TypeNode 中 。 


F3 ERA XE HAE PERRA 
让 我 们 再 来 看 一 下 DefinedFunction 类 的 处 理 (代码 清单 9.19 ), 
代码 清单 9.19 TypeResolverstvisit(DefinedFunction) ( compiler/TypeResolver.java ) 
































public Void visit(DefinedFunction func) { 
resolveFunctionHeader(func); 
visitStmt (func.body()); 
return null; 


) 


private void resolveFunctionHeader (Function func) { 

bindType (func.typeNode ()); 

for (Parameter param : func.parameters()) { 
// arrays must be converted to pointers in a function parameter. 
Type t - typeTable.getParamType (param.typeNode().typeRef()); 
param.typeNode ().setType (t); 





) 





主要 的 处 理 都 集中 在 resolveFunctionHeader 方法 中 ， 因 此 这 里 仅 对 此 方法 进行 讲解 。 
在 函数 定义 中 ， 如 下 这 些 地 方 存在 TypeRef。 


返回 1 的 类 型 
参 的 类型 
































resolveFunctionHeader 方法 的 第 1 行 用 于 处 理 返回 值 的 类 型 。func .typeNode () 
返回 保存 有 返回 值 类 型 的 TypeNode 对 象 ， 再 调用 bindType 方 法 将 返回 值 的 类 型 从 
TypeRef 转换 为 Type. 

resolveFunctionHeader 方法 从 第 2 行 开始 都 是 对 形 参 进行 的 处 理 。 用 foreach 语句 
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对 func.parameters() 进行 遍历 ， 取 出 表示 形 参 的 Parameter 对 象 。 然 后 用 param. 
typeNode () 取出 Parameter 对 象 中 的 TypeNode 对 象 ， 将 TypeRef 转换 为 Type。 

只 有 在 将 形 参 的 TypeRef 转换 为 Type 时 使 用 了 TypeTable 类 的 getParamType 方法 。 
它 和 通常 的 get 方法 的 区 别 在 于 数组 的 TypeRef 会 被 转换 为 指针 的 Type。C 语言 (Cb ) 中 形 
参 类 型 是 数组 的 情况 下 完全 等 同 于 指针 类 型 ， 因 此 在 此 处 统一 成 为 指针 类 型 。 

至 此 函数 定义 中 所 有 的 TypeRef 都 转换 为 了 Type。 之 后 只 需要 用 同样 的 方法 处 理 刚 才 列 
举 的 所 有 节点 即 可 。 具 体内 容 请 参考 cbe 的 源 代码 。 

下 一 章 我 们 将 继续 深入 了 解 语义 分 析 。 

















— 












语义 分 析 〈2 ) 
静态 类 型 检查 


本 章 我 们 将 看 一 下 语义 分 析 中 以 静态 类 型 检查 为 
中 心 的 类 型 相关 的 处 理 。 
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本 节 将 检查 “void 类 型 的 数组 ”这 样 不 正确 的 类 型 定义 。 


FJ 问题 概要 
本 节 将 对 类 型 定义 的 下 面 3 个 问题 进行 检查 。 

包含 void 的 数组 、 结 构 体 、 联 合体 
员 重 复 的 结构 、 联 合体 
. 循环 定义 的 结构 体 、 联 合体 

具体 来 说 ， 第 1 条 就 是 对 voiq [3] 这 样 的 持 有 void 类 型 成 员 的 类 型 进行 检查 ; 第 2 条 就 
是 对 持 有 2 个 及 2 个 以 上 同名 成 员 的 结构 体 、 联 合体 进行 检查 ; 第 3 条 最 为 款 手 ， 是 对 成 员 中 
包含 自己 本 身 的 结构 体 、 联 合体 进行 检查 。 所 谓 “ 成 员 中 包含 自己 本 身 ”， 举 例 来 说 ， 就 是 指 下 
面 这 样 的 定义 。 
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CD 


























struct point [( 
Etui c CIT FII EESIT 
hs 


这 里 所 说 的 “成 员 中 包含 自己 本 身 ” 是 指 直 接 包含 自己 本 身 ， 通 过 指针 来 应 用 自己 本 身 是 
没有 问题 的 。 例 如 刚才 的 例子 ， 如 果 是 下 面 这 样 的 话 就 没有 问题 了 。 








struct point [( 
SEPUet pole tT 


刚才 的 例子 中 存在 直接 的 循环 定义 ， 因 此 一 眼 就 能 看 出 来 。 还 有 如 下 所 示 的 间接 循环 定义 
的 情况 ， 也 需要 注意 。 
struct point x ( 
struct point y y; 
he 
typedef struct point x my point x; 
struct point y ( 


my point x x; 


hs 
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上 述 例 子 中 还 夹杂 着 使 用 typedef 定义 的 类 型 ， 因 此 调查 起 来 更 为 繁琐 。 


实现 的 概要 


“包含 void 的 类 型 ”和 “成 员 重 复 的 类 型 ”可 以 通过 全 面 检查 来 解决 ， 这 个 方法 虽然 比较 












































问题 在 于 检查 “循环 定义 的 类 型 ”的 方法 。 进 行 这 样 的 类 型 检查 需要 将 类 型 定义 的 整体 当 
作 图 (graph) 来 思考 。 

一 般 情况 下 ,说 起 “图 ”， 人 们 想到 的 就 是 折线 图 这 样 的 图 形 ， 但 程序 中 的 图 并 不 是 这 样 。 
程序 中 的 图 是 指 结构 的 抽象 化 表现 。 

图 10.1 就 是 一 个 简单 的 图 的 例子 。 图 由 点 和 连接 点 的 线 组 成 ， 点 称 为 节点 (node), ERA 
的 线 称 为 边 ( edge )。 边 存在 方向 性 的 图 称 为 有 向 图 (directed graph )， 边 不 存在 方向 性 的 图 称 为 
无 向 图 (undirected graph )。 























图 10.1 有 向 图 的 例子 


例如 铁路 线路 图 ， 如 果 将 车 站 作为 节点 ， 将 线路 作为 边 的话 ， 就 可 以 用 无 向 图 来 表示 。 

将 类 型 的 定义 抽象 为 图 时 ， 可 以 将 类 型 作为 节点 ， 将 该 类 型 对 其 他 类 型 的 引用 作为 边 。 
例如 结构 体 的 定义 ， 将 该 结构 体 的 类 型 作为 节点 ， 向 成 员 的 类 型 的 节点 连接 一 条 边 。 使 用 
typedef 的 情况 下 ， 将 新 定义 的 类 型 作为 节点 ， 向 原来 的 类 型 节点 引 一 条 边 。 

了 来 看 一 个 例子 。 现 在 假设 有 如 下 所 示 的 定义 。 
































struct st ( 
SEE Jereuaene ee 
long len; 


hg 
typedef unsigned int uint; 


struct point ( 
ulint x; 
Quee) SR 


bs 
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可 见 


， 如 医 




















图 中 存在 闭环 。 检 查 是 否 存 在 循环 定义 ， 


Cr 


图 10.2 类 型 定义 的 图 ( 不 存在 循环 定义 的 情况 ) 


如 果 发 生 循环 定 义 ， 那 么 在 生成 类 型 定义 的 图 时 ， 
下 的 图 如 图 10.3 所 示 。 





typedef struct point. x my. point. x; 











检测 有 向 图 中 的 闭环 的 算法 





图 中 某 处 必定 存在 闭环 。 


图 10.3 ”类 型 定义 的 图 ( 存在 循环 定义 的 情况 ) 














只 需 检查 类 型 


J 定义 的 





图 中 是 否 存 在 闭环 即 可 。 


循环 定义 情况 








因为 边 存 在 方向 性 ， 所 以 类 型 定义 的 图 属于 有 向 图 。 要 检测 有 向 图 中 是 否 存在 闭环， 可 以 



























































































































































































































































使 用 如 下 算法 。 

1. 选 择 任意 一 个 节点 ( 类 型 ) 并 标注 为 “查找 中 

2. 治 着 边 依次 访问 所 有 与 该 节点 相 邻 的 节点 

3. 如 果 访问 到 的 节点 没有 标注 任何 状态 ， 则 将 该 节点 标注 为 “查找 中 ”， 如 果 标注 了 “查找 结 
x", mI + 理 ， 返 回 之 前 的 节点 ; 如 果 已 经 标注 为 “查找 中 "， 则 说 明 存在 闭环 

4 从 当前 的 节点 重复 步骤 2 和 3， 如 果 已 经 没有 可 访问 的 相 邻 节点 ， 则 将 该 节点 标注 为 “查找 
结束 "， 并 沿 原 路 返 

5 按照 上 述 流程 对 所 有 节点 进行 处 理 ， 如 果 查 找 过 程 中 没有 遇 到 “查找 中 ”状态 的 节点 ， 就 说 
明 不 

上 述 算法 中 使 用 了 “有 向 图 的 深度 优先 检索 ”来 检测 闭环 。 简 单 地 说 ， 该 算法 的 概要 就 是 





只 要 节点 有 未 访问 的 相 邻 节点 就 试 着 访问 ， 调 查 是 否 会 回 到 原来 的 节点 "。 从 算法 执行 过 程 中 


10.1 ”类 型 定义 的 检查 





的 某 一 时 刻 来 看 ， 就 是 在 为 从 起 始 节 点 到 某 一 节点 的 路 径 上 的 所 有 节点 标注 上 “查找 中 ”的 状态 。 
初次 接触 该 算法 会 觉得 很 难 ， 可 能 看 一 下 代码 更 容易 理解 。 可 以 简单 地 夯 一 下 类 型 定义 的 
， 试 着 一 边 遍历 图 一 边 调 试 代码 。 


F 结构 体 、 联 合体 的 循环 定义 检查 


说 了 这 么 久 算法 ， 下 面 我 们 来 看 一 下 检查 循环 定义 的 男 数 checkRecursiveDefinition,， 
如 代码 清单 10.1 所 示 。 
代码 清单 10.1  TyptTable&checkRecursiveDefiniton ( type/TypeTable.java ) 








protected void checkRecursiveDefinition(Type t, ErrorHandler h) { 
 checkRecursiveDefinition(t, new HashMap«Type, Object»(), h); 


) 


static final protected Object checking = new Object(); 
Static final protected Object checked - new Object(); 


protected void  checkRecursiveDefinition(Type t, 
Map«Type, Object» marks, 
ErrorHandler h) { 
if (marks.get(t) == checking) { 
h.error(((NamedType)t).location(), 
"recursive type definition: " + t); 
return; 
) 
else if (marks.get(t) == checked) ( 
return; 
) 
else ( 
marks.put(t, checking); 
if (t instanceof CompositeType) { 


CompositeType ct - (CompositeType)t; 
for (Slot s : ct.members()) { 
 CcheckRecursiveDefinition(s.type(), marks, h); 


) 
) 


else if (t instanceof ArrayType) ( 
ArrayType at - (ArrayType)t; 
checkRecursiveDefinition(at.baseType(), marks, h); 
) 
else if (t instanceof UserType) { 
UserType ut - (UserType)t; 
checkRecursiveDefinition(ut.realType(), marks, h); 


) 


marks.put(t, checked); 
) 
算法 说 明 中 的 “标注 状态 ”的 实现 方式 是 “将 Type 对 象 和 它 的 状态 作为 一 组 保存 在 
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Map 对 象 marks 中 ”， 这 是 上 述 算法 的 重点 。 表 示 状 态 的 对 象 并 没有 特别 的 规定 ，cbc 中 会 将 
static final 的 属性 checking 和 checked 赋值 给 object 的 实例 ， 以 此 来 表示 状态 。 
将 上 述 方法 的 结构 转换 为 自然 语言 ， 如 下 所 示 ， 请 结合 算法 说 明 看 一 下 。 





void checkRecursiveDefinition(Type t, Map seen) { 
if (如果 的 状态 为 “查找 中 ) { 


输出 错误 并 return 

















} 
else if (t 的 状态 为 “查找 结束 ”) { 


return; 





} 

else { — // 访问 的 节点 还 没有 被 标注 状态 
将 上 标注 为 “查找 中 - 
访问 所 有 和 已 相 邻 的 节点 ( 调用  checkRecursiveDefinition) 
将 上 标注 为 “查找 结束 












































结构 体 、 联 合体 、 数 组 、typedef 所 定义 的 类 型 以 外 的 类 型 只 有 整数 类 型 和 指针 ， 因 此 除 
了 上 述 4 个 类 型 以 外 ， 其 他 情况 下 都 不 可 能 出 现 边 。 包 含 某 类 型 的 指针 的 情况 下 ， 因 为 不 会 产 
生 循 环 依赖 ， 所 以 不 会 有 问题 。 
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表达 式 的 有 效 性 检查 








本 节 将 对 “1=3”“&g5” 这 样 无 法 求 值 的 不 正确 的 表达 式 进 行 检 查 。 


问题 概要 

本 节 将 检查 如 下 这 些 问题 。 

e 为 无 法 赋值 的 表达 式 赋 值 ( 例 : 1 =2+2) 

e 使 用 非法 的 函数 名 调用 函数 ( 例 : "string" ("$dNn", i)) 

e 操作 数 非法 的 数组 引用 ( 例 : 1[0] ) 

e 操作 数 非法 的 成 员 引 用 ( 例 : 1.memb ) 

e 操作 数 非法 的 指针 间接 引用 (Bl: 1-»memb ) 

e 对 非 指针 的 对 象 取 值 (BU: 1) 

e 对 非 左 值 的 表达 式 取 地 址 

cbe 中 在 调用 上 述 表 达 式 的 节点 的 type 方法 试图 获取 类 型 时 ， 抛 出 SemanticError 异 
o Ah, IEZI (operand ) 指 的 是 x+y 中 的 x 或 *ptr 中 的 ptr 这样 的 作为 运算 对 象 的 表 
INe 

刚 开 始 实现 cbe 时 ， 上 述 检查 是 和 下 一 阶段 的 静态 类 型 检查 同时 进行 的 。 但 同时 处 理 抛 出 

异常 的 检查 和 不 抛 出 异常 的 检查 比较 复杂 ， 因 此 将 获取 类 型 时 会 抛 出 异常 的 表达 式 分 开 检 查 。 


实现 的 概要 









































































































































pt ak 








相对 于 之 前 较 复杂 的 类 型 的 循环 定义 检查 ， 这 次 的 检查 要 简单 得 多 。 各 个 问题 的 表达 式 的 
模式 显而易见 ， 因 此 只 要 对 所 有 的 模式 逐个 检查 即 可 。 具 体例 子 以 及 问题 的 检测 方法 如 表 10.1 
所 示 ， 其 中 包括 了 刚才 列举 的 问题 。 

表 10.1 问题 和 检测 方法 






































有 问题 的 表达 式 示例 检测 方法 

1=2+3 检查 左边 是 否 为 可 赋值 的 表达 式 

"string"("% d\n", i) 检查 操作 数 的 类 型 是 否 是 指向 函数 的 指针 

1[0] 检查 操作 数 的 类 型 是 否 是 数组 或 指针 

1.memb 检查 操作 数 的 类 型 是 否 是 拥有 成 员 memb 的 结构 体 或 联合 体 
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有 问题 的 表达 式 示例 检测 方法 

1->memb 检查 操作 数 的 类 型 是 否 是 指向 拥有 成 员 memb 的 结构 体 或 联合 体 的 指针 
*1 检查 操作 数 的 类 型 是 否 是 数组 或 指针 

&1 检查 操作 数 的 类 型 是 否 是 可 赋值 的 表达 式 

++1 检查 操作 数 的 类 型 是 否 是 可 赋值 的 表达 式 














检测 问题 的 方法 大 致 可 分 为 两 类 : 检查 表达 式 是 否 可 以 被 赋值 和 检查 操作 数 的 类 型 。 赋 值 、 
地 址 运算 符 、 自 增 、 自 减 的 检测 属于 前 者 ， 其 他 属于 后 者 。 

另外 ， 获 取 本 次 要 检查 的 表达 式 的 类 型 时 可 能 会 抛 出 异常 ， 因 此 如 果 不 经 思考 直接 像 前 面 
那样 进行 检查 ， 就 会 有 连锁 抛 出 异常 的 问题 。 例 如 ， 请 看 如 下 表达 式 。 
































*** (1r) 


上 述 表达 式 的 问题 在 于 1++。 但 是 如 果 在 检查 * 的 操作 数 时 去 计算 操作 数 的 类 型 ， 那 么 在 
计算 1++ 的 类 型 时 就 会 产生 错误 。 结 果 就 是 “1++”“* (1++)” U"* (144)" "x (1++) ”都 
会 出 错 ， 因 而 会 检测 出 4 个 错误 。 然 而 对 于 程序 员 来 说 ， 需 要 修改 的 地 方 铠 怕 仪 仪 是 I++ 这 一 
处 ， 所 以 理想 的 做 法 是 只 检测 出 1 处 错误 。 

至 今 为 止 的 做 法 都 是 尽量 避免 抛 出 异常 ， 但 这 次 要 在 发 现 错误 时 即刻 抛 出 异常 ， 并 跳 转 到 
不 会 发 生 连 锁 错 误 的 安全 之 处 。 作 为 “不 会 发 生 连 锁 错 误 的 安全 之 处 ”， 这 次 采用 了 语句 的 末 
尾 。 发 生 错 误 时 ， 包 含 该 表达 式 的 语句 整体 会 被 跳 过 。 这 样 既 能 确实 避免 发 生 连锁 错误 ， 又 能 
在 一 次 编译 过 程 中 尽 可 能 多 地 检测 出 错误 。 




















DereferenceChecker 类 的 启动 


让 我 们 来 具体 看 一 下 DereferenceChecker 类 的 代码 。 和 之 前 一 样 ， 先 从 类 的 构造 函数 
开始 ，DereferenceChecker 类 的 构造 函数 如 代码 清单 10.2 所 示 。 


代码 清单 10.2 DereferenceChecker 的 构造 函数 ( compiler/DereferenceChecker.java ) 





private final TypeTable typeTable; 
private final ErrorHandler errorHandler; 


public DereferenceChecker(TypeTable typeTable, ErrorHandler h) { 
this.typeTable - typeTable; 
this.errorHandler - h; 


} 
DereferenceChecker 类 的 构造 孙 数 的 参数 有 TypeTable 对 象 和 ErrorHandler 对 象 ， 
并 在 构造 函数 中 将 它们 保存 到 类 的 属性 中 。Dereferencechecker 类 的 属性 仅 此 2 个 而 已 。 
接着 ， 作 为 人 口 的 check 方法 的 代码 如 代码 清单 10.3 所 示 。 
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代码 清单 10.3 DereferenceChecker#check ( compiler/DereferenceChecker.java ) 


public void check (AST ast) throws SemanticException { 
for (DefinedVariable var : ast.definedVariables()) ( 
checkToplevelVariable (var); 
) 
for (DefinedFunction f : ast.definedFunctions()) { 
check (£.body ()) ; 
) 
if (errorHandler.errorOccured()) { 
throw new SemanticException("compile failed."); 
) 
) 


该 方法 中 有 2 个 foreach 语句 。 第 1 个 foreach 语句 对 全 局 变量 ( 的 初始 化 代码 ) 进行 逐一 处 理 ， 
第 2 个 foreach 语句 对 函数 进行 逐一 处 理 。 这 里 的 处 理 可 以 概括 为 遍历 全 部 节点 并 进行 上 述 检查 。 














SemanticError 异常 的 捕获 


之 前 提 到 了 DereferenceChecker 类 在 发 现 错误 时 会 抛 出 异常 并 跳 转 到 语句 的 末尾 。 首 
先 让 我 们 来 看 一 下 上 述 机 制 的 实现 。 处 理 程 序 块 所 对 应 的 节点 BlockNode 的 代码 如 代码 清单 
10.4 所 示 。 





代码 清单 10.4  DereferenceCheckerstvisitBlockNode) ( compiler/DereferenceChecker.java ) 


public Void visit(BlockNode node) { 
for (DefinedVariable var : node.variables()) { 
checkVariable(var); 


) 


for (StmtNode stmt : node.stmts()) { 


try ( 
check (stmt); 
} 


catch (SemanticError err) { 


} 
} 


return null; 


) 


第 1 个 foreach 语句 对 在 该 程序 块 中 声明 的 变量 的 初始 化 代码 进行 遍历 。 

第 2 个 foreach 语句 是 具体 处 理 程序 块 的 代码 。 把 每 一 个 语句 的 处 理 用 try ~ catch 包围 
起 来 捕获 SemanticError 异常 后 丢弃 。 这 里 的 SemanticError 是 “无 法 获取 类 型 ”时 抛 出 
的 异常 类 。 这 样 的 实现 在 发 现 错误 时 能 够 立即 跳 过 当前 语句 ， 移 至 下 一 语句 的 处 理 。 


非 指 针 类 型 取 值 操作 的 检查 
接着 让 我 们 看 一 下 检查 有 问题 的 表达 式 的 代码 。 
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检查 问题 的 代码 都 比较 类 似 ， 因 此 我 们 从 两 类 检查 方法 中 各 选取 一 种 ， 来 看 一 下 实现 的 代码 。 
首先 来 看 检查 操作 数 的 类 型 的 例子 ， 让 我 们 看 一 下 表示 取 值 运算 符 (* ) 的 DereferenceNode 
的 处 理 ( 代码 清单 10.5 )。 该 方法 检查 取 值 运算 符 的 操作 数 的 类 型 是 否 为 指针 。 


代码 清单 10.5  DereferenceCheckerstvisitDereferenceNode) ( compiler/DereferenceChecker.java ) 





public Void visit (DereferenceNode node) { 
super.visit (node); 
if (! node.expr().isPointer()) { 
undereferableError (node.location()); 


} 
handleImplicitAddress (node); 
return null; 


) 


首先 ， 通过 super.visit (node) 调用 基 类 visitor 的 方法 遍历 操作 数 (node .expr O0 ) 
( 即 检查 操作 数 )。 

接着 ， 调 用 操作 数 node .expr () 的 ijsPointer 方 法， 检查 操作 数 的 类 型 是 否 是 指针 ， 
即 检查 是 否 可 以 进行 取 值 。 如 果 无 法 取 值 ， 则 调用 undereferableError 方法 输出 编译 错误 。 

最 后 ,调用 handleImplicitAddress 方法 对 数组 类 型 和 函数 类 型 进行 特别 处 理 。 该 处 
理 还 和 接 下 来 AddressNode 的 处 理 相 关 ， 因 此 在 讲解 完 AddressNode 之 后 进行 说 明 。 


F3 获取 非 左 值 表达 式 地 址 的 检查 


接着 是 检查 操作 数 是 否 为 左 值 的 例子 ， 我 们 来 看 一 下 表示 地 址 运算 符 的 AddressNode 的 
处 理 。DereferenceChecker 类 中 人 处理 AddressNode 的 代码 如 代码 清单 10.6 所 示 。 


代码 清单 10.6 DereferenceChecker#visit(AddressNode) ( compiler/DereferenceChecker.java ) 









































public Void visit (AddressNode node) { 
super.visit (node); 
if (! node.expr().isLvalue()) { 
SemanticError(node.location(), "invalid expression for &"); 
) 
Type base - node.expr().type(); 
if (! node.expr().isLoadable()) { 
// node.expr.type is already pointer. 
node.setType (base); 
) 


else ( 





node.setType (typeTable.pointerTo (base)); 


) 


return null; 


) 








首先 对 node .expr () 调用 isLvalue 方 法， 检查 &expr 中 的 expr 是 否 是 可 以 进行 取 
址 操作 的 表达 式 。 
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ExprNode#isLvalue 是 检查 该 节点 的 表达 式 是 否 能 够 获取 地 址 的 方法 。Cb PRAK 
10.2 中 列举 的 5 种 表达 式 能 够 获取 地 址 。 
表 10.2 Cb 中 能 够 获取 地 址 的 表达 式 




































































表达 式 的 种 类 cbc 的 节点 表达 式 示例 
变量 引 VariableNode var 

成 员 引 MemberNode st.memb 
通过 指针 访问 成 员 PtrMemberNode ptr->memb 
数组 引 ArefNode al[0] 

取 值 DereferenceNode *ptr 














ExprNode 类 提供 了 isLvalue 方法 的 默认 实现 一 一 直接 返回 false, Hb ijsLvalue 的 
EN false, MX 10.2 中 的 5 个 类 都 继承 自 LHSNode， 在 LHSNode 中 重 写 isLvalue 
方法 ,将 其 返回 值 修改 为 true。 因 此 只 有 上 述 5 个 节点 的 isLvalue 方法 会 返回 trues 

剩余 的 语句 用 于 确定 AddressNodae 的 类 型 。 通 常 node .expr () .isLoadable() 会 
返回 true， 有 即 执行 else 部 分 的 处 理 。&gexpr 的 类 型 是 指向 expr 类 型 的 指针 ， 因 此 指向 
node .expr () .type () 的 指针 类 型 可 以 作为 节点 整体 的 类 型 来 使 用 。 


隐 式 的 指针 生成 


在 本 节 的 最 后 ， 我 们 来 聊 一 下 隐 式 的 指针 生成 的 话题 。 

C 语言 和 Cb 中 单个 数组 类 型 或 函数 类 型 的 变量 表示 数组 或 函数 的 地 址 。 例 如 ， 假 设 变 量 

puts 的 类 型 为 国 数 类 型 〈 一 般 称 为 男 数 指针 )， 那 么 puts 和 &puts 得 到 的 值 是 相同 的 。 因 此 
代码 清单 10.5 中 调用 的 nandleImplicitAddress 方法 将 数组 类 型 或 也 数 类 型 转换 为 了 指向 
数组 或 函数 类 型 的 指针 ， 即 隐 式 地 生成 指针 类 型 。 
在 将 puts 的 类 型 设置 为 指 癌 函数 的 指针 的 同时 ， 还 必须 将 &puts 的 类 型 也 设置 为 指向 函 
数 的 指针 。 这 就 是 代码 清单 10.6 中 的 chen 部 分 一 一 当 node .expr () .isLoadable() 为 假 
的 情况 下 ， 即 node .expr () 的 类 型 是 数组 或 函数 的 情况 下 进行 特别 处 理 ， 使 得 gputs 的 类 型 
和 puts 的 类 型 相 一 致 。 

刚才 我 们 讨论 了 类 型 匹配 的 话题 ， 和 类 型 相对 应 ， 变 量 的 值 也 必须 匹配 。 值 的 匹配 处 理 将 
在 中 间 代 码 转换 过 程 中 进行 ， 关 于 这 部 分 内 容 ,我 们 在 第 11 章 还 会 讲解 。 

最 后 给 大 家 讲 个 段子 。puts 是 指向 函数 的 指针 ， 因 此 它 的 取 值 运 算 *puts 的 结果 是 函数 
类 型 ， 但 这 样 又 会 隐 式 地 转换 为 指 癌 函数 的 指针 。*puts 还 是 指 问 函数 的 指针 ， 因 此 仍然 可 
以 进行 取 值 运算 ,仍然 会 转换 为 指向 函数 的 指针 。 像 这 样 可 以 无 限 重复 下 去 。 所 以 C 语言 
“gputs” “puts”“*puts”“**xputs”“***xputs” 的 值 都 是 相同 的 。 

cbe 中 也 忠实 地 实现 了 这 恶 梦 般 的 规范 。 
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问题 概要 

几乎 所 有 C 语言 (Cb ) 的 操作 都 对 操作 数 的 类 型 有 所 限制 。 例 如 结构 体 之 间 无 法 用 + 进行 
加 法 和 运算， 指针 和 数值 之 间 无 法 用 * 进行 乘法 运算 ， 将 数组 传递 给 参数 类 型 为 int 型 的 函数 会 
出 现 莫 名 其 妙 的 结果 。 

C 语 言 (Cb ) 在 这 样 的 情况 下 会 对 允许 的 操作 数 类 型 进行 限制 。 例 如 * 操作 只 适用 于 类 型 
相同 的 数值 之 间 。 在 编译 过 程 中 检查 是 否 符合 这 样 的 限制 的 处 理 就 是 静态 类 型 检查 (static type 
checking )。 

虽然 C 语 言 (Cb ) 对 操作 数 的 类 型 有 着 严格 的 限制 ， 但 另 一 方面 它 允 许 操作 数 类 型 的 隐 式 
转换 。 例 如 二 元 运算 * 只 允许 在 相同 类 型 的 整数 之 间 进 行 。 但 是 如 果 在 不 同类 型 的 数值 之 间 进 
行 * 运算 , 为 了 能 够 正常 运算 ,编译 右 会 自动 对 操作 数 的 类 型 进行 转换 。 这 样 的 转换 就 称 为 隐 
式 类 型 转换 (implicit conversion )。 例 如 ， 当 int 类 型 的 值 和 Long 类 型 的 值 进 行 乘法 运算 时 ， 
编译 需 会 将 两 个 操作 数 统一 为 Long 类 型 。 

由 于 隐 式 类 型 转换 的 存在 ， 看 上 去 似乎 是 不 同类 型 的 数值 在 进行 乘法 运算 ， 实 则 并 非 如 此 ， 
是 先 对 操作 数 进 行 类 型 转换 后 再 进行 运算 ， 所 以 我 们 必须 认识 到 就 * 操作 自身 来 说 ， 必 须 是 相 
同类 型 的 操作 数 才 能 进行 运算 。 

另外 ， 在 一 些 不 得 不 强行 转换 为 特定 类 型 的 情况 下 也 会 发 生 隐 式 类 型 转换 。 例 如 ， 当 
return 返回 值 的 类 型 和 也 数 返回 值 的 类 型 不 一 致 时 ， 必 须 转换 为 函数 返回 值 的 类 型 ,赋值 运 
算 时 必须 转换 为 和 左 值 一 致 的 类 型 等 。 显 式 声 明 的 函数 返回 值 或 变量 类 型 无 法 轻易 改变 ， 因 此 
只 能 利用 隐 式 转换 来 改变 值 的 类 型 。 

在 静态 类 型 检查 过 程 中 也 会 实施 隐 式 类 型 转换 。 


实现 的 概要 


cbe 中 由 TypeChecker 类 负责 静态 类 型 检查 。 如 前 所 述 ，TypeChecker 类 的 处 理 内 容 包 
括 类 型 检查 和 隐 式 类 型 转换 这 两 方面 。 无 论 哪 个 处 理 ， 都 只 需要 简单 地 处 理 单个 节点 即 可 。 类 



































































































































加 CastNode 对 象 即 可 。 
例如 ， 试 想 一 下 检查 二 元 运算 符 * 对 应 的 BinaryopNode 对 象 的 场景 。* 两 侧 的 表达 式 
因此 如 果 左 右 表 达 式 中 存在 数组 或 结构 体 类 型 的 话 ， 就 表示 存在 类 型 


必须 为 相同 的 数值 类 型， 


错误 。 








即便 左右 表达 式 都 是 数值 类 型 ， 
signed int, AM unsigned short 的 
为 singed int。 这 时 在 右 侧 表达 式 中 添加 月 











这 样 隐 式 类 型 转换 的 处 理 就 完成 了 。 


Cb 中 操作 数 的 类 型 





还 可 





103 ”静态 类 型 检查 | 


171 


型 检查 时 只 需 对 各 节点 〈 各 运算 ) 的 限制 逐个 进行 检查 ， 当 检查 的 结果 需要 隐 式 类 型 转换 时 添 





能 存在 类 型 不 一 致 的 情况 。 例 如 左 侧 的 类 型 为 
情况 下 ， 就 必须 将 右 侧 的 unsigned short 转换 
日 于 转换 为 signed int 类 型 的 castNode 即 可 。 





关于 类 型 检查 ， 让 我 们 稍微 具体 地 讲 一 下 检查 的 标准 。 
Cb 的 运算 中 存在 的 一 些 限制 如 表 10.3 所 示 。 可 见 和 C 语言 基本 一 致 ， 仅 增加 了 Cb 函数 的 
返回 值 不 能 是 结构 体 或 联合 体 ， 以 及 结构 体 或 联合 体 不 能 用 等 号 直接 赋值 这 样 的 限制 。 另 外 ，C 
语言 中 实际 上 人 允许 1 [4] 这 样 的 表达 式 ， 但 在 Cb 中 会 报错 。 
表 10.3 ”Cb 的 静态 类 型 检查 

















































































































































































































检查 对 象 的 表达 式 限制 

变量 除 void 类 型 以 外 

赋值 的 左 值 整数 或 指针 

函数 的 返回 值 整数 或 指针 

函数 的 形 参 整数 或 指针 或 数组 

函数 的 实 参 整数 或 指针 或 数组 

eturn 的 值 整数 或 指针 或 数组 ， 符合 函数 的 定义 
条 件 表 达 式 整数 或 指针 或 数组 

switch 语句 的 条 件 表达 式 | 整数 

c?t:e t 和 e 为 相同 类 型 的 整数 、 指 针 、 数 组 
x+y x 和 y 分 别 是 指针 和 整数 ， 或 者 是 类 型 相同 的 整数 
x-y x 和 y 分 别 是 指针 和 整数 ， 或 者 是 类 型 相同 的 整数 
X xy x 和 y 是 类 型 相同 的 整数 

x/y x 和 y 是 类 型 相同 的 整数 

x%y x 和 y 是 类 型 相同 的 整数 

x&y x 4ü y 是 类 型 相同 的 整数 

x|y x 和 y 是 类 型 相同 的 整数 

x^y x 和 y 是 类 型 相同 的 整数 

x<<y x 和 y 是 类 型 相同 的 整数 

x>>y x 和 yy 是 类 型 相同 的 整数 

x == x 和 y 是 类 型 相同 的 整数 、 指 针 、 数 组 
xl=y x 和 yy 是 类 型 相同 的 整数 、 指 针 、 数 组 
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( 续 ) 
检查 对 象 的 表达 式 限制 
x<y x 和 yy 是 类 型 相同 的 整数 、 指 针 、 数 组 
x<=y x 和 y 是 类 型 相同 的 整数 、 指 针 、 数 组 
x»y x 和 y 是 类 型 相同 的 整数 、 指 针 、 数 组 
x>=y x 和 y 是 类 型 相同 的 整数 、 指 针 、 数 组 
x && y x fü y 是 类 型 相同 的 整数 
xlly x 和 y 是 类 型 相同 的 整数 
+x x 是 整数 
-x x 是 整数 
~x x 是 整数 
Ix x 是 整数 或 指针 或 数组 
++X x 是 整数 或 指针 
--X x 是 整数 或 指针 
X++ X 是 整数 或 指针 
x-- x 是 整数 或 指针 
f(a) f 是 函数 指针 ，a 符合 函数 f 的 定义 
ali] a 是 指针 或 数组 ，i 是 整数 
*p p 是 指针 或 数组 
&x x 为 左 值 
(t)x x 的 类 型 可 转换 为 类 型 








上 表 中 的 “指针 ”还 包括 作为 函数 形 参 的 数组 。 将 函数 的 形 参 声明 为 数组 的 情况 下 ， 其 实 


质 就 是 指针 。 


隐 式 类 型 转换 





下 面 我 们 详细 讲 一 下 C 语言 中 隐 式 类 型 转换 的 规范 。 


C 语言 标准 中 所 记录 的 隐 式 类 型 转换 的 规则 相当 复杂 ， 但 如 果 只 考虑 某 种 固定 的 CPU 和 
OS 的 话 就 简单 很 多 了 。char 的 长 度 是 Sbit, short 的 长 度 是 16bit，int M long 的 长 度 








32bit 的 情况 下 ， 转 换 规则 如 下 。 











1. 首先 将 signed char. unsigned char, signed short, unsigned short $f] 


























signed int， 再 按照 下 述 步骤 比较 两 者 的 类 型 








2. 按 照 unsigned long. signed long. unsigned int, signed int 的 优 # 





型 ， 使 两 者 的 类 型 相 一 致 



































和 上 顺序 选 





3. 只 有 当 一 方 为 unsigned int, 5—7;79 signed long 时 ,要 例外 地 统一 成 unsigned long 








例如 有 下 面 这 样 (unsigned char 类 型 ) * (signed long 类 型 
下 该 表达 式 会 发 生 怎样 的 隐 式 类 型 转换 。 














unsigned char x 3; 
Signed long y - 


下 ED 


Bi 


Ei 
AE 





Ds 


) 的 表达 式 ， 试 着 考虑 
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首先 根据 规则 1 将 unsigned char 转换 为 signed int， 再 比较 signed int 和 
signed long。 然 后 根据 规则 2，sigend long 的 优先 级 更 高 ， 因 此 将 两 者 统一 为 signed 
long。 综 上 ， 实 际 上 表达 式 的 计算 如 下 所 示 。 


(signed long)x * y; 


即使 不 知道 这 部 分 变换 也 不 会 有 什么 问题 。 应 用 C 语言 的 话 只 需要 显 式 的 类 型 转换 即 可 ， 
自己 设计 语言 的 话 完 全 可 以 选择 更 为 简洁 易 懂 的 标准 。 只 是 Cb 遵循 的 原则 是 : 只 要 没有 特别 的 
原因 就 采用 和 C 语言 相同 的 标准 ， 因 此 这 部 分 完全 是 按照 C 语言 的 标准 来 实现 的 。 但 说 实话 ， 
笔者 并 不 觉得 这 样 实现 有 多 大 的 意义 。 


TyperChecker 类 的 启动 


从 这 里 开始 我 们 要 进入 讲解 代码 的 环节 。 依 然 从 构造 函数 看 起 ，Typechecket 类 的 构造 
函数 如 代码 清单 10.7 所 示 。 
代码 清单 10.7 TypeChecker 类 的 构造 函数 ( compiler/TypeChecker.java ) 


public TypeChecker(TypeTable typeTable, ErrorHandler errorHandler) { 
this.typeTable - typeTable; 
this.errorHandler - errorHandler; 





























) 


TypeChecker 类 的 属性 包括 TypeTable 对 象 和 ExrorHandler 对 象 。 这 部 分 没什么 问 








接着 ， 作 为 TypeChecker 类 的 人 口 的 check 函数 如 代码 清单 10.8 所 示 。 
代码 清单 10.8 TypeChecker#check ( compiler/TypeChecker.java ) 


DefinedFunction currentFunction; 


public void check(AST ast) throws SemanticException { 
for (DefinedVariable var : ast.definedVariables()) ( 
checkVariable(var); 
) 
for (DefinedFunction f : ast.definedFunctions()) { 
currentFunction - f; 
checkReturnType (f) 
checkParamTypes (f) 
check (£.body ()) ; 


n 
i 


) 


if (errorHandler.errorOccured()) { 
throw new SemanticException("compile failed."); 


} 
} 








在 该 方法 中 ， 第 1 个 foreach 语句 对 全 局 变量 的 定义 进行 遍历 ， 第 2 个 foreach 语句 对 函数 
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定义 进行 遍历 ， 并 实施 类 型 检查 。 

第 1 个 foreach 语句 中 使 用 的 checkvariable 方法 在 检查 变量 的 类 
时 ， 还 对 变量 的 初始 化 表达 式 进 行 遍历 。 

第 2 个 foreach 语句 中 使 用 的 eneckReturnType 方法 检查 孔 数 返回 值 的 类 型 是 否 为 非 结 
构 体 、 联 合体 或 数组 。 这 里 再 重复 一 下 ，Cb 中 函数 不 能 返回 结构 体 或 联合 体 。 

checkParamTypes 方法 检查 函数 形 参 的 类 型 是 否 为 非 结 构 体 、 联 合体 或 void。 因 为 Cb 
中 函数 参数 的 类 型 不 能 是 结构 体 或 联合 体 。 

最 后 调用 的 check 是 裔 历 参 数 节 点 的 方法 。 各 节点 类 会 重 写 该 函数 ， 通 过 调用 check (f. 
body () ) 对 函数 体 进行 遍历 。 


型 是 否 为 非 void 的 同 















































三 y 二 元 运算 符 的 类 型 检查 

接 下 来 只 要 实现 对 各 方 点 的 类 型 检查 和 隐 式 类 型 转换 ，TypeChecker 类 的 实现 就 完成 了 。 
作为 类 型 检查 和 隐 式 类 型 转换 的 例子 ， 让 我 们 看 一 下 表示 二 元 运算 的 闻 点 BinaryOpNode 类 
的 处 理 。Typechecket 类 中 处 理 BinaryOpNode 类 的 代码 如 代码 清单 10.9 所 示 。 
代码 清单 10.9 TypeChecker#visit(BinaryOpNode) ( compiler/TypeChecker.java ) 




















public Void visit(BinaryOpNode node) ( 
super.visit (node); 
if (node.operator().equals("«") || node.operator().equals("-")) { 
expectsSameIntegerOrPointerDiff (node); 


node.operator 


node.operator().equals("»»")) { 


else if (node.operator().equals("*") 

|| node.operator().equals("/") 
|| node.operator().equals("$") 
|| node.operator().equals("&") 
|| node.operator().equals("|") 
|| node.operator().equals("^") 
| Q ( ! 
E ( 

ct 


else if (node.operator() .equals ("==") 
|| node.operator().equals("!-") 
node.operator().equals("«") 
[| p q 
node .operator () .equals ("<=") 
[| p q 
node.operator().equals("»") 
| | P q 
|| node.operator().equals("»-")) { 
expectsComparableScalars (node); 
) 
else ( 


throw new Error("unknown binary operator: 


) 


return null; 


" + node.operator()); 
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首先 ， 通 过 super.visit (node) 调用 基 类 visitor 的 实现 ， 即 遍历 BinaryOpNode 
对 象 以 下 的 节点 ， 由 此 对 BinaryopNode 的 left ( 左 表 达 式 ) M right (ARKIN ) 进行 类 
型 检查 和 隐 式 类 型 转换 。 为 了 正确 地 进行 类 型 检查 ， 必 须 在 函数 的 一 开始 进行 上 述 处 理 。 

接着 ,根据 node .operator () 的 不 同 分 开 处 理 。node .opezrator () 是 将 节点 所 表示 
的 运算 以 "+" 或 "mx" 这样 的 字符 串 的 形式 返回 的 函数 。 每 种 运算 的 限制 各 不 相同 ， 因 此 按照 相 
同 的 限制 分 组 后 进行 检查 。 

第 1 组 是 "+" 和 "-"。 该 组 运算 符 要 求 左 右 表 达 式 一 方 为 指针 ， 另 一 方 为 整数 ， 或 者 双方 
为 相同 类 型 的 整数 。expectsSameIntegerOrPointerDiff 就 是 检查 上 述 限 制 的 方法 。 

TS 22H "wn, n/n, ngu, ngu, "|n, "An, "cc". "iz", 这 组 运算 符 要 求 左右 双方 
表达 式 为 相同 类 型 的 整数 。 用 expectsSameInteger 方法 对 上 述 限制 进行 检查 。 

WA lÈ "ss", "le", "<", "<=", ">", ">=" 等 比较 运算 符 。 该 组 运算 符 要 求 左 
右 双方 的 表达 式 为 相同 类 型 的 scalar 值 。scalar Æ C 语言 中 是 整数 类 型 、 指 针 以 及 枚 举 类 型 的 
总 称 。 用 expectsComparableScalars 方法 对 该 限制 进行 检查 。 

以 expects ~ 开头 的 图 数 的 实现 大 致 都 是 检查 表达 式 的 类 型 之 后 进行 隐 式 类 型 转换 ， 因 此 
我 们 只 需要 看 其 中 的 一 个 的 代码 。 检 查 "*" 和 "/" 等 表达 式 的 expectsSameIntegez 方 法 
的 代码 如 代码 清单 10.10 所 示 。 
代码 清单 10.10 TypeChecker#expectsSamelnteger ( compiler/TypeChecker.java ) 




































































private void expectsSameInteger(BinaryOpNode node) { 
if (! mustBeInteger(node.left(), node.operator())) return; 
if (! mustBeInteger(node.right(), node.operator())) return; 
arithmeticImplicitCast (node); 


) 























第 1 个 让 语句 检查 左 侧 表达 式 是 否 为 整数 类 型 ， 如 果 不 是 mustBeInteger 方法 会 报错 。 
接着 的 站 语句 检查 右 侧 表达 式 是 否 为 整数 类 型 ， 如 果 不 是 同样 mustBeIntege 方法 会 报错 。 
最 后 ， 调 用 arithmeticImplicitCast 方法 插入 隐 式 类 型 转换 后 结束 处 理 。 


隐 式 类 型 转换 的 实现 


负责 隐 式 类 型 转换 的 arithmeticImplicitcast 方法 的 代码 如 代码 清单 10.11 所 示 。 
代码 清单 10.11 TypeChecker#arithmeticImplicitCast ( compiler/TypeChecker.java ) 


























private void arithmeticImplicitCast (BinaryOpNode node) { 
Type r = integralPromotion(node.right().type()); 
Type 1 = integralPromotion (node.left() .type()); 

Type target = usualArithmeticConversion(l, r); 





if (! l.isSameType (target)) { 
// insert cast on left expr 
node.setLeft(new CastNode(target, node.left())); 
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} 
if (! r.isSameType (target)) { 
// insert cast on right expr 
node.setRight (new CastNode(target, node.right())); 


) 


node.setType (target); 


) 


首先 ， 将 左右 两 侧 表达 式 的 类 型 用 ijntegralPromotion 方法 提升 到 int 类 型 以 上 ， 即 
将 char 类 型 和 short 类 型 转换 为 signed int 类 型 。 这 样 的 转换 在 C 语言 的 规范 中 称 为 整 
型 提升 (integral promotion )。integralPromotion 方法 的 实现 比较 简单 、 直 接 ， 这 里 予以 省 
略 ， 请 直接 参考 源 代码 。 

接着 调用 usualArithmeticConversion 方法 获取 运算 所 需要 的 操作 数 类 型 ， 使 左右 表 
达 式 双方 的 类 型 符合 要 求 的 操作 数 类 型 ， 即 进行 类 型 转换 。 类 型 转换 时 用 newCcastNode 方法 
生成 CastNode 并 添加 到 左右 节点 。 

运算 时 操作 数 类 型 的 规则 我 们 已 经 讲 过 了 ， 这 里 来 回忆 一 下 。 只 有 unsigned int 
FI signed long 的 运算 时 统一 为 unsigned l1ong， 其 他 情况 下 按照 unsigned long, 
signed long, unsigned int, signed int 的 优先 顺序 来 统一 左右 表达 式 的 类 型 。 上 述 转 
换 在 C 语言 的 标准 中 称 为 寻常 算数 转换 (usual arithmetic conversion )。 

usual arithmetic conversion 的 规则 ， 比 起 文字 说 明 ， 直 接 看 代码 更 容易 到 
usualArithmeticConversion 方法 的 代码 摘要 如 代码 清单 10.12 所 示 。 





























解 。 


na 








代码 清单 10.12. TypeCheckerstusualArithmeticConversion ( compiler/TypeChecker.java ) 


private Type usualArithmeticConversion(Type 1, Type r) { 
Type s int - typeTable.signedInt(); 
Type u int - typeTable.unsignedInt(); 
Type s long - typeTable.signedLong(); 
Type u long - typeTable.unsignedLong(); 
if ( (l.isSameType(u int) && r.isSameType(s long)) 
|| (r.isSameType(u int) && l.isSameType(s long))) { 
return u long; 











) 

else if (l.isSameType(u long) || r.isSameType(u 1ong)) ( 
return u long; 

) 

else if (l.isSameType(s long) || r.isSameType(s 1ong)) ( 
return s long; 

) 

else if (l.isSameType(u int) || r.isSameType(u int)) { 
return u int; 








) 


else ( 
return s int; 


) 


10.3 ”静态 类 型 检查 





第 1 个 if 语句 用 于 处 理 unsigned int M signed long 的 情况 ,之 后 以 unsigned 
long, singed long" 的 顺序 统一 左右 操作 数 的 类 型 。 











— 
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o 
A 静态 类 型 检查 和 类 型 推导 





























cbc 的 静态 类 型 检查 是 从 抽象 语法 树 的 叶子 节点 开始 依次 对 类 型 进行 确认 ， 即 自 下 而 上 的 类 型 
确认 。 说 起 Cb 的 抽象 语法 树 的 叶子 节点 中 的 符号 primary, JE “FE” “函数 调用 ”或 “ 字 
mE" X 3 者 的 类 型 是 明确 可 知 的 。 变 量 和 函数 的 类 型 是 由 程序 员 声 明 的 ， 字 面 量 的 类 型 是 由 语 
言 的 标准 确定 的 。 因 此 从 叶子 节点 开始 自 下 而 上 进行 处 理 就 一 定 能 确认 所 有 表达 式 的 类 型 。 
仔细 想 一 下 ， 其 实 未 必 一 定 要 自 下 而 上 地 进行 类 型 检查 。 例 如 ， 假设 Cb 的 二 元 运算 符 + 的 左 
侧 表 达 式 和 右 侧 表达 式 的 类 型 都 必须 为 into 3844 + 的 左 侧 表达 式 和 右 侧 表达 式 都 应 该 是 int 类 
型 ， 这 样 思考 的 话 ， 同 样 可 以 自 上 而 下 地 进行 类 型 检查 
自 上 而 下 地 确定 类 型 会 带 来 哪些 好 处 呢 ? 自 上 而 下 地 确定 类 型 ， 意 味 着 无 需 确定 抽象 语法 树叶 
子 节点 的 类 型 ， 即 程序 员 可 以 不 必 声 明 变 量 或 函数 的 类 型 。 像 这 样 自 上 而 下 地 确定 表达 式 类 型 的 方 
法 称 为 类 型 推导 (type inference )。 

类 型 推导 多 用 于 Haskell 或 ML 等 函数 型 语言 ( functional programming language ) 之 中 。 如 
果 编 译 器 实现 了 类 型 推导 功能 ， 那 么 就 可 以 省 略 大 多 数 变量 的 类 型 声明 ， 使 程序 更 为 简洁 。 

关于 类 型 推导 本 书 就 介绍 到 这 里 ， 感 兴趣 的 读者 可 以 阅读 第 22 章 中 介绍 的 图 书 。 




































































































































































































































































































































































中 间 代 码 的 转换 


本 章 将 介绍 cbc 中 间 代 码 的 结构 ， 以 及 从 抽象 语 
法 树 到 中 间 代 码 的 转换 。 
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cbc 的 中 间 代 码 








本 节 我 们 来 介绍 一 下 cbe 中 间 代 码 的 结构 。 

中 间 代 码 的 显示 

cbe 的 中 间 代 码 是 仿照 国外 编译 器 相关 图 书 Modern Compiler Implementation 中 所 使 用 的 名 
为 Tree 的 中 间 代 码 设 计 的 。 顾 名 思 义 ，Tree 是 一 种 树 形 结构 ， 其 特征 是 简单 ， 而 且 方 便 转换 为 
机 器 语言 。 

例如 代码 清单 11.1 中 的 Cb 程序 ， 在 cbe 中 会 被 转换 为 如 图 11.1 所 示 的 中 间 代 码 。 
代码 清单 11.1 inc.cb 























int 
main(int argc, char** argv) 


{ 


return ++argc; 


) 










««Bin»» 


««Return»» 
expr 
««Addr»» ««Var»» 
entity: argc op: ADD entity: argc 
left right 

««Var»» 
entity: argc 


11.1 Cb 的 中 间 代 码 


cbe 的 中 间 代 码 是 单纯 的 语句 (Stmt ) 列表 ,语句 由 表达 式 ( Expr ) 组 合 而 成 。 以 inc. 
cb 为 例 ，Assign Ñ Return 为 语句 ，Var、Bin、Int 为 表达 式 。 

原本 inc.cb 中 只 有 1 条 语句 ， 中 间 代 码 中 却 出 现 了 Assign 和 Return 2 条 语句 。 像 这 
样 在 转换 到 中 间 代 码 后 语句 增加 的 情况 是 比较 常见 的 。 

打开 cbc 命令 中 的 选项 开关 ， 可 以 直接 在 画面 上 输出 中 间 代 码 。 要 显示 中 间 代 码 ， 可 以 在 
执行 cbc 命令 时 添加 - -dump- ir 选项 。 
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$ cbc --dump-ir inc.cb 


RE 


(inc.cb:1) 


variables: 
functions: 


««DefinedFunction»» 
name: 
isPrivate: 
type: 


[Eee 
main 
false 


int(int, char**) 


body: 


想 查 看 代码 生成 怎样 的 中 间 代 码 时 ， 就 可 以 使 月 





<<Assign>> (inc.cb:4) 
es 
<<Addr>> 
type: INT32 
entity: argc 
rhs: 
<<Bin>> 
CYPERN Z 
Op: ADD 
left: 
«c«Var»» 
type: INT32 
entity: 
right: 
mb 
(wise IBNHES/ 
value: v 
(inc.cb:4) 


argc 


«c«Return»» 

expr: 
««Var»» 
type: INT32 
entity: argc 








组 成 中 间 代 码 的 类 





组 成 中 间 代 码 的 类 如 表 11.1 所 示 。 



























































表 11.1 组 成 中 间 代 码 的 类 

类 基 类 含义 

IR Object 中 间 代 码 的 根 

Assign Stm 赋值 

CJump Stm 条 件 跳 转 

Jump Stm 无 条 件 跳 转 

Switch Stm 多 分 支 跳 转 (switch ) 
LabelStmt Stm 标签 ( 跳 转 目标 ) 
ExprStmt Stm 仅 包 含 一 个 表达 式 的 语句 
Return Stm return 

Uni Expr 一 元 运算 ( OP e ) 











这 个 功能 试 着 输出 中 间 代 码 。 
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( 续 ) 
Bin Expr 二 元 运算 (1OPT) 
Call Expr 函数 调 
Addr Expr 取 地 址 ( &var ) 
Mem Expr 取 值 ( *var ) 
Var Expr PEE 
Int Expr 整数 常量 
Str Expr 字符 串 常 量 




















所 有 语句 的 节点 都 继承 自 Stmt 类 ， 表 达 式 的 节点 继承 自 Expr 类 。 

从 表 11.1 中 可 以 看 出 ， 比 起 抽象 语法 树 的 节点 类 ， 中 间 代 码 的 类 的 种 类 大 幅 减少 。 抽 象 语 
法 树 的 语句 和 表达 式 的 节点 加 起 来 多 达 30 多 种 ， 而 中 间 代 码 中 仅 有 16 种 。 因 此 本 章 的 关键 在 
于 如 何 用 较 少 的 节点 种 类 来 表达 和 原来 相同 的 含义 。 

另外 ，cbe 的 中 间 代 码 中 没有 像 if 或 while 这 样 的 流程 控制 语句 ， 完 全 依靠 跳 转 语句 
(jump statement ) 来 实现 流程 控制 。 跳 转 语句 类 似 于 C iH (Cb) 中 的 goto 语句 ， 能 够 跳 转 
到 同一 函数 内 的 任意 语句 。cbc 的 中 间 代 码 提 供 了 CJump (条 件 跳 转 ), Jump (无 条 件 跳 转 )、 
Switch (多 分 文 跳 转 ) 3 种 跳 转 语句 。 

一 般 情况 下 ， 机 器 语言 中 的 流程 控制 只 有 跳 转 指令 。 将 Cb 中 丰富 的 流程 控制 一 下 子 转换 为 
只 有 跳 转 指令 的 控制 机 制 非常 困难 ， 因 此 尽量 在 中 间 代 码 和 代码 生成 阶段 逐渐 地 向 机 器 语言 的 
表现 形式 靠拢 。 



































[F3 中 间 代 码 节点 类 的 属性 
中 间 代 码 各 节点 类 的 属性 如 表 11.2 所 示 。 
表 11.2 中 间 代 码 节 点 类 的 属性 




























































































































































































类 属性 含义 
Assign Ihs 赋值 的 左 表 达 式 
rhs 赋值 的 右 表 达 式 
CJump cond 条 件 表达 式 
thenLabel 条 件 为 真 的 情况 下 的 跳 转 目标 
elseLabel 条 件 为 假 的 情况 下 的 跳 转 目标 
Jump Label 跳 转 目标 
Switch cond 条 件 表达 式 
cases 人 体 条 件 和 跳 转 目标 组 成 的 链表 
defaultLabel 默认 的 跳 转 目标 
LabelStmt label 标签 ( 指定 跳 转 目 标的 对 象 ) 
ExprStmt expr 执行 的 表达 式 
Return expr 表示 返回 值 的 表达 式 
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(E) 
类 属性 含义 
Uni op 运算 的 种 类 
expr 于 运算 的 表达 式 
Bin op 运算 的 种 类 
left 左 表达 式 
right 右 表 达 式 
Call expr 表示 函数 的 表达 式 
args 参数 列表 
Addr expr 获取 地 址 的 表达 式 
Mem expr 取 值 的 表达 式 
Var entity DefinedVariable 对 象 
Int value 值 
Str entry ConstantEntry 对 象 
除了 表 11.2 中 的 属性 之 外 ， 还 有 表示 语句 节点 的 Location 类 型 的 属性 和 表示 表达 式 节 点 














的 Type 类 型 的 属性 。 其 中 表示 表达 式 节 点 的 Type 类 型 和 至 今 为 止 所 使 用 的 Type 不 是 同一 
类 型 ， 这 里 是 net .LIoveruby.cflat.asm.Type， 而 至 今 为 止 所 使 用 的 Type 类 型 为 net . 
Lovezruby.cflat.type.Type。 今 后 分 别 将 这 两 者 简写 为 asm.Type 和 type.Type。 


F3 中 间 代 码 的 运算 符 和 类 型 











中 间 代 码 使 用 的 asm. Type 类 是 利用 Javas 中 引入 的 enum 定义 的 ， 并 | 


所 示 的 实例 。 





表 11.3 中间 代 码 中 的 类 型 ( asm.Type 对 象 ) 











类 型 名 含义 
T8 8bit 整数 
T16 16bit 整数 
T32 32bit 整数 









































o 





























运算 符 含义 

ADD 加 法 (+) 

SUB 减法 (-) 

MUL 乘法 (*) 

S_DIV 有 符号 的 除法 U) 








日 提供 了 如 表 11.3 


通过 编写 Type .INT8 或 Type.INT16， 就 能 够 获取 上 述 这 些 值 。 在 Switch 语句 的 
case iir "I LAW "Type." 

Uni 类 和 Bin 类 的 op 属性 的 类 型 为 op，0P 类 和 asm.Type 一 样 是 利用 enum 定义 的 。 
op 实例 的 种 类 如 表 11.4 所 示 。 
表 11.4 中 间 代 码 的 运算 符 ( Op 对 象 ) 
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( 续 ) 
运算 符 含义 
U_DIV 无 符号 的 除法 U) 
S_MOD 有 符号 的 取 模 (9%) 
U_MOD 无 符号 的 取 模 (%) 
BIT_AND 按 位 逻辑 与 (&) 
BIT_OR 按 位 逻辑 或 (|]) 
BIT_XOR 按 位 逻辑 异 或 C) 
BIT_LSHIFT 逻辑 左 移 (无 符号 、<<) 
BIT_RSHIFT 逻辑 右 移 ( 无 符号 、>>) 
ARITH_RSHIFT 算数 右 移 ( 有 符号 、>>) 
EQ 比较 (==) 
NEO 比较 (12) 
S_GT 有 符号 的 数值 比较 (>) 
S_GTEO 有 符号 的 数值 比较 (>= 
S_LT 有 符号 的 数值 比较 (<) 
S_LTEO 有 符号 的 数值 比较 (<= 
U_GT 无 符号 的 数值 比较 (>) 
U_GTEO 无 符号 的 数值 比较 (>= 
U_LT 无 符号 的 数值 比较 (<) 
U_LTEO 无 符号 的 数值 比较 (<= 
UMINUS 取 反 (-) 
BIT_NOT 按 位 取 反 (~) 
NOT 逻辑 非 (1) 
S_CAST 有 符号 数值 的 类 型 转换 
U_CAST 无 符号 数值 的 类 型 转换 

















asm.Type 和 op 的 特点 在 于 类 型 (asm. Type) 无 符号 ， 取而代之 的 是 在 运算 符 (Op) 
的 类 型 中 包含 符号 信息 。 机 器 语言 的 指令 会 因为 操作 数 有 无 符号 而 产生 变化 ， 因 此 在 中 间 代 码 
的 阶段 应 尽量 向 机 器 语言 靠拢 ， 这 样 在 代码 生成 阶段 就 能 稍微 简单 些 了 。 

另外 ， 中 间 代 码 中 没有 结构 体 、 数 组 和 指针 。 在 中 间 代 码 及 之 后 的 阶段 ， 这 些 值 都 用 ( 整 
数 的 ) 指针 来 表示 。 


各 类 中 间 代 码 


除了 cbe 树 形 结构 的 中 间 代 码 以 外 ， 还 有 各 式 各 样 的 其 他 结构 的 中 间 代 码 。 例 如 三 地 址 代 
码 (three-address code ) 就 是 非常 著名 的 中 间 代 码 之 一 。 三 地 址 代码 是 如 下 这 样 的 指令 。 




















2 = X TOBEY 


三 地 址 代码 的 指令 由 x、y、z、0P 这 四 者 组 成 ， 因 此 称 为 四 元 式 (quadruple )。 三 地 址 代 
码 的 特点 是 方式 上 类 似 于 机 器 语言 ， 容 易 通 过 重 排 指令 进行 优化 。 
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在 充分 进行 优化 的 编译 器 中 会 使 用 多 种 中 间 代 码 。 

例如 GCC 中 除了 在 第 1 章 提 到 的 RTL 以 外 ,还 使 用 了 名 为 GENERIC 和 GIMPLE 的 中 间 
代码 。RTL 最 接近 机 咒语 言 的 表现 形式 ， 其 次 是 GIMPLE, 最 后 是 GENERIC. 

还 有 名 为 Coins 的 编译 器 ， 它 先 将 抽象 语法 树 转 换 为 名 为 HIR (High-level Intermediate 
Representation ) 的 树 形 中 间 代 码 ， 并 进行 代码 优化 。 之 后 再 将 HIR 转换 为 LIR (Low-level 
Intermediate Representation ) 这 样 一 种 接近 机 咒语 言 的 中 间 代 码 ， 并 进行 进一步 的 优化 。 


中 间 代 码 的 意义 


本 闻 的 最 后 ， 让 我 们 稍微 详细 地 来 说 一 下 引入 中 间 代 码 的 意义 。 

我 们 应 该 有 目的 地 使 用 中 间 代 码 。 例 如 ， 如 果 和 希望 充分 运用 原始 语言 的 信息 并 进行 优化 ， 
应 该 使 用 近似 于 抽象 语法 树 的 树 型 中 间 代码 。 如 果 想 在 接近 机 器 语言 的 层面 对 内 存 的 使 用 等 进 
行 优化 ， 那 就 应 该 使 用 像 三 地 址 代码 这 样 更 接近 机 咒语 言 的 中 间 代码 。 如 果 不 需要 优化 只 是 希 
望 尽 快 地 输出 机 器 语言 ， 那 么 不 使 用 中 间 代 码 也 是 选项 之 一 。 无 论 是 上 述 何 种 情况 ， 都 应 该 清 
楚 是 出 于 什么 目的 而 使 用 中 间 代 码 。 

cbe 中 使 用 中 间 代 码 是 为 了 提高 代码 的 可 读 性 ， 使 其 更 易于 理解 。 同 时 也 有 为 cbe 保留 进 一 
步 优化 的 余地 的 意图 。 

刚 开 始 时 cbe 并 不 经 由 中 间 代 码 ， 而 是 从 抽象 语法 树 直 接生 成 机 器 语言 。 但 这 样 的 话 就 不 
得 不 在 代码 生成 器 中 处 理 Cb 的 各 类 节点 ， 使 代码 生成 器 的 代码 变 得 复杂 、 难 以 理解 。 

另外 ， 进 行 优化 时 ， 如 果 没 有 中 间 代 码 ， 可 以 想象 工作 量 会 大 幅 增加 。 例 如 ， 试 着 考虑 如 


下 两 条 语句 ， 假 设 n 为 int 类 型 的 变量 。 































































































上 述 情况 下 两 条 语句 的 意思 是 完全 一 样 的 ， 并 且 执 行 后 n 的 值 都 不 会 改变 ， 所 以 即使 不 执 
行 也 不 会 有 问题 。 因 此 可 以 在 编译 时 将 这 两 条 语句 删除 。 

但 是 两 条 语句 所 对 应 的 抽象 语法 树 的 节点 分 别 为 BinaryOPNode fll OpAssignNode, 
此 如 果 要 删除 这 两 条 语句 ， 就 必须 对 双方 的 节点 实施 同样 的 优化 ， 即 优化 代码 会 重复 出 现 。 

在 C 语 言 (Cb ) 中 ， 一 种 含义 可 以 用 很 多 种 形式 的 代码 来 表示 。 如 果 进 行 优 化 时 要 考虑 所 
有 的 表现 形式 ， 那 么 优化 的 工作 量 就 会 爆炸 性 地 增加 。 

那么 如 果 先 转换 为 中 间 代 码 的 话 会 如 何 ” 上 述 两 条 语句 的 中 间 代 码 是 相同 的 ， 因 此 可 以 通 
过 一 处 代码 进行 优化 。 这 就 是 使 用 中 间 代 码 的 优势。 
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抽象 语法 树 的 遍历 和 返回 值 


IRGenerator 类 和 语义 分 析 的 类 群 一 样 ， 使 用 visitor 模式 对 抽象 语法 树 进行 遍历 ， 但 
是 有 一 点 不 同 之 处 。 

语义 分 析 的 Visitor 类 的 visit 方法 的 返回 值 都 是 Void 类 型 ， 而 IRGenerator % 
的 返回 值 并 不 都 是 void。 具体 来 说 ， 处 理 表达 式 (ExprNode) W visit 方法 的 返回 值 为 
Expr， 即 返回 的 是 中 间 代 码 的 表达 式 对 象 。 

语义 分 析 基 本 上 只 进行 检查 ， 不 会 向 抽象 语法 树 中 添加 信息 。 而 在 IRGenerator 类 中 需 
要 生成 中 间 代 码 的 树 ， 并 返回 生成 的 结果 ， 因 此 使 用 了 visit 方法 的 返回 值 。 

那么 处 理 语句 (StmtNode ) 的 visit 方 法 的 返回 值 又 是 怎样 的 呢 ? 处 理 语 句 的 visit 
方法 的 返回 值 和 之 前 一 样 是 Void。 这 是 因为 语句 所 对 应 的 中 间 代 码 的 Stmt 对 象 会 被 设置 到 属 
性 stmts 的 列表 之 中 ， 通 过 这 样 的 方式 来 返回 中 间 代 码 的 节点 。 


IRGenerator 类 的 启动 


让 我 们 从 IRGenerator 类 的 人 口 开始 依次 看 一 下 。 入 口 函 数 generate 的 代码 如 代码 清 
单 11.2 所 示 。 
代码 清单 11.2 generate 方法 ( compiler/IRGenerator.java ) 






























































public IR generate(AST ast) throws SemanticException { 
for (DefinedVariable var : ast.definedVariables()) ( 
if (var.hasInitializer()) { 
var.setIR(transformExpr(var.initializer())); 
) 
) 
for (DefinedFunction f : ast.definedFunctions()) { 
f.setIR(compileFunctionBody (f)); 
) 
if (errorHandler.errorOccured()) { 
throw new SemanticException("IR generation failed."); 


) 
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return ast.ir(); 


) 


第 1 个 foreach 语句 将 全 局 变量 的 初始 化 表达 式 转换 为 中 间 代 码 。 第 2 foreach 语句 将 所 
定义 的 函数 的 本 体 转换 为 中 间 人 代码。 函数 本 体 的 转换 比较 重要 ， 因 此 让 我 们 稍微 详细 地 看 一 下 


这 部 分 。 


函数 本 体 的 转换 








负责 转换 函数 本 体 的 方法 是 compileFunctionBody。 它 的 代码 如 代码 清单 11.3 所 示 。 


代码 清单 11.3 compileFunctionBody 方法 ( compiler/IRGenerator.java ) 











List«Stmt» stmts; 
LinkedList«LocalScope» scopeStack; 
LinkedList«Label» breakStack; 

LinkedList«Label» continueStack; 


Map«String, JumpEntry» jumpMap; 


public List«Stmt» compileFunctionBody (DefinedFunction f) ( 


stmts - 


ScopeStack 


- new 


new ArrayList«Stmt»(); 
LinkedList«LocalScope»(); 


breakStack - 
continueStack 


jumpMap - new 


new 











LinkedList«Label»(); 
= new LinkedList«Label»(); 


HashMap«String, JumpEntry»(); 


transformStmt (f.body()); 
checkJumpLinks (jumpMap) ; 
return stmts; 


) 


compileFunctionBody 中 对 一 些 对 象 的 属性 进行 ( 
11.5 所 示 。 
表 11.5 各 函数 中 使 用 的 属性 














E) 初始 化 。 各 个 属性 的 含义 如 表 
































































































































属性 目的 

stmts 保存 由 语句 转换 而 成 的 中 间 代 码 的 节点 
scopeStack 在 生成 临时 变量 时 ， 获 取 当 前 的 作用 域 
breadkStack 表示 break 语句 的 “当前 的 ” 跳 转 目的 地 的 栈 
continueStack 表示 continue 语句 的 “当前 的 ” 跳 转 目 的 地 的 栈 
jumpMap 保存 goto 语句 的 标签 

















在 这 些 属 性 之 中 ， 特 别 重要 的 是 stmts。 所 有 Stmt 对 象 都 被 保存 在 该 属性 的 列表 中 。 








属性 的 初始 化 之 后 





， 执行 transformStmt (上 .bpdqy())， 将 函数 的 本 体 (C£. body 0) 





转换 为 中 间 人 代码。 转换 的 结果 被 保存 到 stmts 属性 的 列表 中 并 返回 。 


transformStmt 方法 的 实现 如 代码 清单 11.4 所 示 。 该 方法 仅 对 参数 的 节点 进行 遍历 ， 
译 为 中 间 代 码 并 添加 到 stmts 属性 中 。 


终 节 点 会 被 统 


























=j 


Hx 
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代码 清单 11.4 transformStmt 方法 ( compiler/IRGenerator.java ) 


private void transformStmt (StmtNode node) { 
node.accept (this); 


) 


作为 语句 的 表达 式 的 判别 


将 语句 节点 (StmtNode ) 转换 为 中 间 代 码 时 使 用 刚才 讲解 的 transformStmt 方法 。 将 
表达 式 节 点 (ExprNode) 转换 为 中 间 代 码 时 需要 分 情况 讨论 : 如 果 表 达 式 是 独立 的 语句 ， 则 使 
H transformStmt 方法 ; 如 果 是 其 他 表达 式 的 一 部 分 ， 则 使 用 transformExpr 方法 。 

例如 下 面 的 赋值 表达 式 就 是 作为 独立 的 语句 使 用 的 。 


























X= Yy; 


但 是 下 面 的 赋值 表达 式 就 是 作为 其 他 表达 式 的 一 部 分 使 用 的 。 








Teel (ea (ee e s) 


两 者 实际 的 区 别 在 于 是 否 使 用 表达 式 的 值 ， 为 了 传达 这 样 的 区 别 ， 需 要 使 用 不 同 的 转换 方法 。 
像 前 者 这 样 表达 式 作为 独立 的 语句 使 用 时 ， 即 便 是 ExprNode 也 要 用 transformstmt 方法 进行 
转换 。 像 后 者 这 样 作为 其 他 表达 式 的 一 部 分 使 用 时 ,使 用 transformExpr 方法 进行 转换 。 

换言之 ,不 使 用 表达 式 的 值 时 用 trasnformstmt 方法 对 表达 式 进 行 转换 ， 使 用 表达 式 的 
值 时 用 transformExpr 方法 进行 转换 。 

ExprNode 的 transformStmt 方法 和 StmtNode 的 transformStmt 方法 的 实现 完全 
相同 ， 都 是 仅仅 调用 node . accept (this). 

男 一 方面 ，transformExpr 方法 的 实现 则 稍 有 不 同 ，transformExpr 方法 的 代码 如 代 
码 清单 11.5 所 示 。 
代码 清单 11.5 transformExpr 方法 ( compiler/IRGenerator.java ) 




















private int exprNestLevel = 0; 


private Expr transformExpr(ExprNode node) { 
exprNestLevel-s-*; 
Expr e - node.accept(this); 
exprNestLevel--; 





return e; 
} 
像 这 样 ，transformExpr 方法 在 转换 节点 时 会 将 属性 exprNextLevel 加 1， 利用 这 个 
属性 就 能 够 判断 当前 转换 中 的 节点 是 否 作为 独立 的 语句 使 用 。isstatement 就 是 为 进行 上 述 
判断 而 提供 的 方法 。isStatement 方法 的 实现 如 代码 清单 11.6 所 示 。 
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代码 清单 11.6 isStatement 方法 ( compiler/IRGenerator.java ) 


private boolean isStatement() { 
return (exprNestLevel -- 0); 


) 








如 果 isStatement () 返回 true, 说 明 转 换 中 的 节点 是 作为 独立 的 语句 使 用 的 ; 如 果 返 
El false， 则 说 明 转 换 中 的 节点 是 作为 其 他 表达 式 的 一 部 分 使 用 的 。AssignNode 等 一 部 分 节 
点 的 转换 处 理会 根据 jsstatement () 方法 的 结果 ， 对 转换 得 到 的 中 间 代 人 码 进行 替换 。 
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流程 控制 语句 的 转换 








本 节 将 对 if, while 这 样 的 流程 控制 语句 以 及 break 等 跳 转 语句 的 转换 进行 讲解 。 


if 语句 的 转换 ( 1 ) 概要 


下 面 让 我 们 来 看 一 下 将 if 语句 转换 为 中 间 代 码 的 代码 。 将 让 语句 对 应 的 AsT 节点 
IfNode 转换 为 中 间 代 码 的 代码 如 代码 清单 11.7 所 示 。 
代码 清单 11.7 IfNode 的 转换 ( compiler/IRGenerator.java ) 








) 
Label elseLabel new Label() 
Label endLabel = new Label(); 
Expr cond - transformExpr (node.cond()); 
if (node.elseBody() == null) { 

cjump (node.location(), cond, thenLabel, endLabel); 

label(thenLabel); 

transformStmt (node.thenBody()); 

label (endLabel); 


Label thenLabel - new Label 


public Void visit(IfNode node) { 
( 
( 








$ 
$ 





} 
else { 
cjump (node.location(), cond, thenLabel, elseLabel); 
label(thenLabel); 
transformStmt (node.thenBody()); 
jump (endLabel); 
label (elseLabel); 
transformStmt (node.elseBody()); 
label (endLabel); 





) 


return null; 


) 





这 里 出 现 了 一 些 新 的 方法 ， 让 我 们 先 来 介绍 一 下 。cjump、jump、label 都 是 生成 中 间 代 
码 的 节点 并 将 其 添加 到 stmt s 属性 中 的 实用 方法 (utility method )。cjump 方法 生成 CJump T 
点 ，jump 方法 生成 Jump 节点 ，label 方法 生成 LapelSstmt 节点 。 各 方法 的 含义 如 表 11.6 
所 示 。 





ni 
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表 11.6 生成 语句 的 中 间 代 码 的 方法 


参数 生成 的 中 间 代 码 的 含义 
loc, cond, t, e 条 件 表 达 式 cond 为 真 则 跳 转 到 标签 t， 为 假 则 跳 转 到 标签 e ( 条 件 跳 转 ) 











跳 转 到 标签 lab ( 无 条 件 跳 转 ) 
定义 标签 lab 


代码 清单 11.7 的 主要 部 分 是 一 个 大 的 i£ 语句 ， 这 个 if 语句 的 上 半 部 分 用 于 处 理 要 转换 的 
if 语句 中 else 部 分 省 略 的 情况 ， 下 半 部 分 用 于 处 理 i£ 语句 中 else 部 分 存在 的 情况 。 


if 语句 的 转换 (2) 没有 else 部 分 的 情况 
下 面具 体 看 一 下 省 略 else 部 分 时 的 代码 ， 如 下 所 示 。 


























cjump(node.location(), cond, thenLabel, endLabel); 
label (thenLabel); 

transformStmt (node.thenBody()); 

label (endLabel); 





cjump, label, transformStmt 都 是 直接 将 中 间 代 码 的 节点 添加 到 stmts 
属性 中 的 代码 ， 因 此 会 按照 和 调用 方法 时 相同 的 顺序 生成 中 间 代 码 ， 即 上 述 代 码 以 
*cJump" "LabelStmt" “then 部 分 的 中 间 代 码 ”“Labelstmt” 的 顺序 生成 中 间 代 码 。 这 部 
分 中 间 代 码 的 结构 如 图 11.2 所 示 。 

















CJump(cond) 














条 件 为 条 件 为 假 

LabelStmt(thenLabel) — 

ee] then 部 分 的 中 间 代 码 
LabelStmt(endLabel) 

11.2 半 语 句 的 中 间 代 码 ( 无 else 部 分 ) 


首先 ， 根 据 cJump 的 结果 ， 当 条 件 表达 式 cona 的 执行 结果 为 真 时 ， 跳 转 到 标签 
thenLabel 的 位 置 ， 这 样 then 部 分 对 应 的 中 间 代 码 就 会 被 执行 。 另 一 方面 ， 当 条 件 表达 式 
cond 的 执行 结果 为 假 时 ， 则 会 跳 转 到 endLabe1l 的 位 置 ， 跳 过 then 部 分 “标签 的 位 置 ” 是 
指 中 间 代 码 节 点 Labelstmt 所 在 的 位 置 ， 即 cbe 的 代码 中 调用 label 方法 的 位 置 。 

另外 ， 如 第 6 章 中 所 述 ，Cb 中 if 语句 的 then 部 分 和 else 部 分 都 只 包含 一 个 语句 。 即 
使 chen 部 分 或 else 部 分 包含 多 个 语句 ， 也 会 被 归并 为 单个 的 BlockNode， 因 此 then 部 分 
fll else 部 分 都 可 以 用 trasnformStmt 方法 进行 编译 。 
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F3 if 语句 的 转换 ( 3 ) 存在 else 部 分 的 情况 
接着 来 看 一 下 不 省 略 else 部 分 时 的 转换 代码 ， 如 下 所 示 。 





cjump (node.location(), cond, thenLabel, elseLabel); 
label (thenLabel); 

transformStmt (node.thenBody()); 

jump (endLabel); 

label(elseLabel); 

transformStmt (node.elseBody()); 

label (endLabel); 


这 次 同样 按照 代码 的 书写 顺序 生成 中 间 代 码 ， 即 按照 “cjJjump”“LabelSsStmt”“then 部 
分 的 中 间 代 码 ”“Jump”“LabelStmt”“else 部 分 的 中 间 代 人 码 ”“Labelstmt” 的 顺序 生成 
中 间 代 码 的 节点 。 其 结构 如 图 11.3 所 示 。 














CJump(cond) 
条 件 为 真 条 件 为 假 
LabelStmt(thenLabel) ——— 
ee then 部 分 的 中 间 代 码 …… 
Jump 
r— LabelStmt(endLabel) 一 | 








一 ~ LabelStmt(endLabel) 
图 11.3 ”if 语句 的 中 间 代 码 ( 有 else 部 分 ) 
在 条 件 表达 式 cona 为 真 的 情况 下 ， 跳 转 到 标签 chenLabel 的 位 置 ， 执行 then 部 分 对 应 
的 中 间 代 码 。 因 为 执行 完 then 部 分 的 语句 后 会 跳 转 到 endLabe 标签 ， 所 以 else 部 分 不 会 被 
执行 。 另 一 方面 ， 当 条 件 表达 式 cona 为 假 时 ， 则 跳 转 到 elseLabel 标签 ,执行 else 部 分 
对 应 的 中 间 代 码 ，then 部 分 不 会 被 执行 。 


F3 while 语句 的 转换 


下 面 让 我 们 来 看 一 下 while 语句 的 中 间 代 码 转 换 。 将 while 语句 对 应 的 AST 市 点 
WhileNode 转换 为 中 间 代 码 的 代码 如 代码 清单 11.8 所 示 。 
代码 清单 11.8 WhileNode 的 转换 ( compiler/IRGenerator.java ) 











public Void visit(WhileNode node) { 
Label begLabel - new Label(); 
Label bodyLabel - new Label(); 
Label endLabel = new Label(); 
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label (begLabel); 

cjump (node.location(), 
transformExpr (node.cond()), bodyLabel, endLabel); 

label (bodyLabel); 

pushContinue (begLabel); 

pushBreak (endLabel); 

transformStmt (node.body()); 

popBreak(); 

popContinue(); 

jump (begLabel); 

label(endLabel); 

return null; 


) 





ic HE pushContinue, pushBreak, popBreak, popContinue 等 新 方法 。 这 些 
方法 将 在 稍 后 另行 说 明 ， 这 里 直接 忽略 即 可 。 这 样 代 码 的 结构 就 非常 简单 了 ， 如 下 所 示 。 








label (begLabel); 
cjump(node.location(), transformExpr(node.cond()), bodyLabel, endLabel); 


label (bodyLabel); 
transformStmt (node.body()); 
jump (begLabel); 

label (endLabel); 


上 述 代 码 生成 的 中 间 代 码 的 结构 如 图 11.4 所 示 。 


r—- LabelStmt(begLabel) 






































CJump(cond) 
条 件 为 条 件 为 假 
LabelStmt(bodyLabel) al 
"ED 本 体 的 中 间 代 码 : oves 
L Jump 
LabelStmt(endLabel) 





图 11.4 while 语句 的 中 间 代 码 的 结构 


根据 cjump 方法 生成 的 cyJump 节点 ， 中 间 代 码 的 含义 如 下 。 当 条 件 表达 式 node. 
cond () 的 执行 结果 为 真 时 ， 跳 转 到 标签 podyLabel 的 位 置 ， 执 行 while 语句 本 体 所 对 应 的 
中 间 代 码 。 本 体 执行 完 后 无 条 件 地 跳 转 回 标签 begLabel 的 位 置 ， 继 续 循 环 。 男 一 方面 ， 当 条 
件 表达 式 的 值 为 假 时 ， 直 接 跳 转 到 标签 endLabel 的 位 置 ， 结 束 循环 。 


F3 break 语句 的 转换 ( 1) 问题 的 定义 
本 节 的 最 后 ， 我 们 来 讲 一 下 和 while 语句 关系 密切 的 break 语句 的 中 间 代码 转换 。 
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break 语句 可 以 用 无 条 件 跳 转 指令 Jump 来 表示 ， 它 和 if 或 while 语句 的 区 别 在 于 跳 转 
目标 标签 是 由 其 他 节点 生成 的 。 
例如 ， 请 见 图 11.5。 





while (x > 0) 
f0; 
break; —, 
90; 跳 转 至 此 处 即 可 
} 


end: 


11.5 break 语句 的 跳 转 目标 


只 需 将 图 11.5 中 的 break 语句 转换 为 跳 转 到 标签 ena 的 位 置 的 跳 转 指令 即 可 ， 但 问题 是 
如 何 获取 标签 ena 的 位 置 。 这 里 的 ena 标签 等 同 于 刚才 出 现 的 endaLabe1， 因 此 需要 以 某 种 方 
式 将 标签 的 位 置 传递 给 break 语句 。 

注意 可 能 会 出 现 while 语句 向 套 的 情况 。pbreak 语句 的 外 层 存在 多 个 while 语句 或 for 
HAJT, break 必须 仅 跳 出 最 内 侧 的 循环 。 

还 要 注意 break 语句 能 够 和 多 种 语句 组 合 使 用 。 具 体 来 说 , while、for、do~while 以 
及 switch 语句 都 可 以 用 break 语句 跳出 处 理 。 

总 的 来 说 ， 需 要 将 break 语句 转换 为 跳 转 到 “包围 break 语句 的 最 内 层 的 while、for、 
do-while 或 switch 语句 ”的 末尾 的 跳 转 指令 。 























break 语句 的 转换 ( 2 ) 实现 的 方针 


为 了 确定 跳 转 语句 的 跳 转 目标 ，cbc 中 使 用 了 如 下 方法 。 


1.IRGenerator 类 的 属性 中 准备 了 栈 的 数据 结构 

2. 在 遍历 AST 时 遇 到 可 以 用 break 跳出 的 语句 (while 语句 等 ) 的 话 ， 将 跳 转 目标 的 标签 压 
入 栈 

3. 将 while 等 语句 的 本 体 转换 为 中 间 代 码 

4. 如 果 在 本 体 的 转换 中 发 现 break 语句 ， 就 将 栈 项 的 标签 作为 跳 转 目标 

5. 本 体 的 转换 结束 后 ， 将 栈 顶 的 标签 弹出 栈 


也 就 是 说 ， 表 示 “ 当 前 break 语句 的 跳 转 目 标 ” 的 标签 始终 位 于 栈 硕 。 作 为 例子 ,我 们 将 
Cb 代码 和 对 应 的 栈 的 情况 总 结 在 图 11.6 之 中 。 
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将 标签 out1 压 入 栈 
while (cond) { » [out1] 
Us 将 标签 out2 压 入 栈 
for (i = 0; i < BUFSIZE; i++) { [out1, out2] 
KP 将 标签 out3 压 入 栈 
switch (i) ( » [out1, out2, out3] 
case 1: 
break; < 一 一 获取 栈 项 的 标签 …out3 
default: 
PETITES 
j 将 标签 弹 Bik [out1, out2] 
out3: 
break; ~ 一 一 获取 栈 顶 的 标签 …out2 
— J2 m [: 出 > 
Out2: 
break; -— — 获取 栈 项 的 标签 …out1 


Out1 : 


图 11.6 利用 栈 来 确定 跳 转 目标 标签 
请 结合 上 图 理解 该 算法 。 


break 语句 的 转换 ( 3 ) 实现 





从 这 里 开始 我 们 将 对 cbe 的 代码 进行 讲解 。 
用 


B 


于 保存 break 语句 的 跳 转 目标 标签 的 栈 存 放 于 IRGenerator 类 的 breakStack 


ni 























ZF, HEN LinkedList 对 象 。 该 栈 借助 如 表 11.7 所 示 的 3 个 方法 进行 操作 。 


表 11.7 操作 breakStack 的 方法 

















方法 含义 
pushBreak(label) 将 标签 label 压 栈 
popBreak() 出 栈 
currentBreakTarget() 返回 位 于 栈 顶 的 标签 





























接着 让 我 们 再 来 看 一 下 压 栈 相关 的 while 语句 的 转换 处 理 代码 。 
代码 清单 11.9 WhileNode 的 转换 ( compiler/IRGenerator.java ) 
{ 


public Void visit(WhileNode node) 
Label begLabel new Label(); 
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Label bodyLabel = new Label(); 
Label endLabel = new Label(); 








label (begLabel); 

cjump (node.location(), 
transformExpr (node.cond()), bodyLabel, endLabel); 

label (bodyLabel); 

pushContinue (begLabel); 

pushBreak (endLabel); 

transformStmt (node.body()); 

popBreak(); 

popContinue(); 

jump (begLabel); 

label (endLabel); 

return null; 


) 


请 注意 刚才 讲解 while 语句 的 转换 时 忽略 的 pushBreak 和 popBreak 的 调用 。 在 转换 
while 语句 的 本 体 (node .body () ) 之 前 , 调用 pushBreak 方法 将 endLabel 压 栈 ， 待 本 


体 的 转换 结束 后 





， 调 用 popBreak 退 栈 。 如 上 述 代码 所 示 ， 只 有 在 while 语句 本 体 的 转换 过 


程 中 才 将 endLabel 压 栈 。 
另 一 方面 ，break 语句 对 应 的 BreakNode 的 转换 代码 如 代码 清单 11.10 所 示 。 


代码 清单 11.10 BreakNode 的 转换 ( compiler/IRGenerator.java ) 


public Void visit(BreakNode node) { 


try { 

jump (node.location(), currentBreakTarget()); 
} 
catch (JumpError err) { 


error (node, err.getMessage()); 


) 


return null; 


) 








主要 的 转换 处 理 位 于 try 代码 块 之 中 。BreakNode 的 转换 是 使 用 currentBreakTarget 
方法 从 breakStack 取出 位 于 栈 顶 的 标签 ， 再 利用 jump 方法 生成 跳 转 到 该 标签 的 跳 转 语句 。 

如 果 在 while 等 语句 之 外 使 用 break 语句 的 话 ，currentBreakTarget 方法 会 抛 出 
JumpError 异常 。 这 时 就 要 用 error 方法 输出 错误 消息 ， 提 示 编 译 错误 。 

至 此 break 语句 的 转换 工作 就 结束 了 。continue 语句 的 转换 可 以 用 完全 相同 的 方式 来 实 
H, 具体 请 参考 源 代码 。 
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没有 副作用 的 表达 式 的 转换 














从 本 方 开始 我 们 来 讲解 将 表示 表达 式 的 节点 转换 为 中 间 代 码 的 方法 。 
首先 我 们 考虑 最 简单 的 没有 副作用 (side effect) 的 表达 式 的 转换 。 


UnaryOpNode 对 象 的 转换 


首先 让 我 们 来 看 一 下 把 UnaryopNode 对 象 转换 为 中 间 代码 的 方法 。UnaryOpNode XE 
对 应 的 中 间 代 码 的 节点 只 有 Uni 这 一 种 ， 因 此 转换 非常 简单 。UnaryOpNode 对 象 的 转换 处 理 
如 代码 清单 11.11 所 示 。 
代码 清单 11.11 UaryOpNode 的 转换 ( compiler/IRGenerator.java ) 














public Expr visit (UnaryOpNode node) { 
if (node.operator() .equals ("+")) { 
// +expr -> expr 
return transformExpr (node.expr()); 


) 
else ( 
return new Uni (asmType (node.type()), 
Op.internUnary (node.operator()), 
transformExpr (node.expr())); 


) 


上 述 方法 中 首先 用 node .opezrator () .equals ("+") 来 检查 UnaryOpNode 对 象 所 表 
示 的 表达 式 的 运算 符 是 否 为 "+"， 如 果 是 "+"， 则 不 生成 Uni 节点 。 一 元 运算 符 "+" 不 进行 
任何 运算 ,可 以 直接 删除 。 因 此 "+" 运算 的 情况 下 可 以 用 transformExpr 方法 只 把 +expr 
中 的 expr 部 分 转换 为 中 间 代 码 。 

transformExpr (node.expr()) 和 node.expr() .accept (this) 基本 相同 ,会 递 
归 地 人 处理 node .expr() 以 下 的 节点 ,将 其 转换 为 中 间 代 人 码 。transformExpr 方法 的 返回 值 
为 中 间 代 码 的 树 Expro 

另 一 方面 ， 当 运算 符 不 为 "+" 时， 则 生成 Uni 节点 。Uni 类 的 构造 函数 的 参数 声明 如 下 所 示 。 

















public Uni (Type type, Op op, Expr expr) 


从 代码 清单 11.11 中 的 调用 构造 函数 可 见 ， 传 给 第 1 个 参数 的 是 asmType (node. 
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type () )。 其 中 asmType 是 将 type .Type 转换 为 asm.Type 的 方法 。 例 如 对 于 Cb 中 的 
int 类 型 ， 该 方法 会 返回 Type .INT32。 














传 给 第 2 个 参数 的 是 Op. internUnary (node.operator()). Op.internUnary 是 将 
抽象 语法 树 中 的 一 元 运算 符 ("+" 等 ) 转换 为 op 的 静态 方法 。 例 如 对 于 Cb 中 的 "-"， 该 方法 
会 返回 op . UMINUS. 

传 给 第 3 个 参数 的 是 transformExpr (node .expr () )。 这 里 和 "+" 运算 符 一 样 ， 将 
+expr 中 的 expr 部 分 转换 为 中 间 代 码 。 

至 此 UnaryOpNode 对 象 的 中 间 代 码 转换 处 理 就 结束 了 。 


BinaryOpNode 对 象 的 转换 


接着 来 看 一 下 稍微 复杂 些 的 BinaryopNode 对 象 的 转换 。 将 BinaryopNode 对 象 转换 为 
中 间 代 码 的 代码 如 代码 清单 11.12 所 示 。 
代码 清单 11.12. BinaryOpNode 的 转换 ( compiler/IRGenerator.java ) 








public Expr visit (BinaryOpNode node) { 


Expr right = transformExpr (node.right()); 
Expr left - transformExpr (node.left()); 
Op op - Op.internBinary (node.operator(), node.type().isSigned()); 


Type t - node.type(); 
Type r - node.right().type(); 
Type 1 - node.left().type(); 





if (isPointerDiff(op, 1, r)) { 
// ptr - ptr -» (ptr - ptr) / ptrBaseSize 
Expr tmp - new Bin(asmType(t), op, left, right); 
return new Bin(asmType(t), Op.S DIV, tmp, ptrBaseSize(1)); 


) 


else if (isPointerArithmetic(op, 1)) { 
// ptr + int -> ptr + (int * ptrBaseSize) 
return new Bin(asmType(t), op, 
left, 


new Bin(asmType(r), Op.MUL, right, ptrBaseSize(1))); 


) 


else if (isPointerArithmetic(op, r)) ( 
// int + ptr -> (int * ptrBaseSize) + ptr 
return new Bin(asmType(t), op, 
new Bin(asmType(1), Op.MUL, left, ptrBaseSize(r)), 
right); 
) 
else ( 


// int + int 
return new Bin(asmType(t), op, left, right); 
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函数 很 长 ， 这 是 因为 为 了 支持 指针 的 运算 ,分 支 数量 有 所 增加 。 首 先 我 们 只 看 基本 的 整数 
运算 的 部 分 。 删 除 代 码 后 半 部 分 的 if£ 语句 中 else 以 外 的 部 分 不 需要 的 函数 定义 也 一 并 删 
除 ， 只 考虑 如 下 代码 。 





Expr right - transformExpr (node.right()); 

Expr left - transformExpr (node.left()); 

Op op - Op.internBinary (node.operator(), node.type().isSigned()); 
Type t = node.type(); 


return new Bin(asmType(t), op, left, right); 


是 不 是 容易 理解 多 了 ? 

一 开始 的 两 行将 BinaryopNode 对 象 节 点 中 的 右 表 达 式 node .right () 和 左 表达 式 
node.left() 用 transformExpr 方法 进行 转换 。 

这 时 ， 注 意 一 定 要 先 处 理 右 表达 式 ， 具 体 原 因 将 在 下 一 节 说 明 。 简 单 来 说 ， 在 转换 有 副 作 
用 的 表达 式 时 ， 最 终生 成 的 代码 会 按 转 换 的 顺序 产生 副作用 ， 即 以 转换 的 顺序 实际 执行 代码 。 
多 数 环境 下 ，C 语言 的 参数 和 表达 式 都 是 按照 从 右 到 左 的 顺序 执行 ，Cb 中 的 参数 和 表达 式 也 应 
该 按照 从 右 到 左 的 顺序 执行 。 所 以 这 里 必须 从 右 侧 的 表达 式 开 始 进行 转换 。 

让 我 们 回 到 代码 ， 看 一 下 最 后 的 return 语句 。 此 处 生成 了 中 间 代 码 的 Bin To Bin% 
的 构造 函数 的 第 1 个 参数 和 Un i 类 的 构造 函数 相同 ， 都 是 asm .Type， 第 2 个 参数 是 运算 答 
(Op )， 第 3 个 参数 和 第 4 个 参数 分 别 是 左右 表达 式 。 第 2 个 参数 中 用 到 的 op. internBinary 
是 将 抽象 语法 树 中 的 二 元 运算 符 ("+"、"*"m、"/" 等 ) 转换 为 中 间 代 码 的 运算 符 (op ) 的 
静态 方法 。 中 间 代 码 的 运算 符 中 包含 符号 信息 ， 因 此 要 通过 参数 传递 是 否 是 有 符号 的 运算 
(node.type().isSigned() A 

像 这 样 ， 除 去 指针 运算 的 话 ，BinaryOpNode 对 象 也 只 是 简单 地 对 应 Bin 节点 。 


[y 指针 加 减 运算 的 转换 
理解 了 基本 部 分 之 后 ， 接 着 让 我 们 来 看 一 下 指针 运算 相关 的 部 分 。 相 应 的 代码 如 下 所 示 。 















































if (isPointerDiff(op, 1, r)) ( 
//| ptr - ptr -» (ptr - ptr) / ptrBaseSize 
Expr tmp - new Bin(asmType(t), op, left, right); 
return new Bin(asmType(t), Op.S DIV, tmp, ptrBaseSize(1)); 
} 
else if (isPointerArithmetic(op, 1)) ( 
// ptr * int -» ptr « (int * ptrBaseSize) 
return new Bin(asmType(t), op, 
left, 
new Bin(asmType(r), Op.MUL, right, ptrBaseSize(1))); 
} 
else if (isPointerArithmetic(op, r)) ( 
// int + ptr -> (int * ptrBaseSize) + ptr 
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return new Bin(asmType(t), op, 
new Bin(asmType(1), Op.MUL, left, ptrBaseSize(r)), 
right); 


) 


最 初 的 部 分 是 “指针 - 指针 ”运算 的 处 理 ， 第 2 部 分 是 “指针 + 整数 ”运算 的 处 理 , 第 3 
部 分 是 “整数 + 指针 ”运算 的 处 理 。 











首先 ,“ 指 针 - 指针 ”的 情况 下 ， 运 算 BinaryOpNodel(-) Bin()) 
结果 还 要 再 除 以 指针 所 指向 的 类 型 的 大 小 ot 有 Nn x V a 
(size), 例如 (31nt*)8- (intx)4 的 结果 | | 
为 (8-4) /sizeof(int)， 即 4/4 等 于 1， ptrl ptr2 || Bin(*) Int(4) 
而 不 是 等 于 4。 因 此 如 图 11.7 所 示 ， 在 运 left (idi 
算 结果 的 节点 的 基础 上 还 要 增加 1 个 Bin. 

第 2 部 分 和 第 3 部 分 是 指针 和 整数 之 RIT pue 
间 的 加 减法 。C 语言 (Cb) 中 指针 类 型 的 RU denen 


值 加 上 整数 相当 于 将 指针 前 移 整 数值 个 单位 。 例 如 int* 类 型 的 ptr 加 2， 从 机 器 语言 的 层面 
来 说 不 是 加 2， 而 是 加 sizeof (int)*2， 即 加 8。 因 此 整数 类 型 的 节点 必须 和 指针 所 指向 类 型 
的 size 进行 乘法 运算 。 

HMH isPointerArithmetic 方法 来 检查 变量 是 否 属于 指针 类 型 。 另 外 ， 因 为 存在 左 
表达 式 为 指针 和 右 表 达 式 为 指针 这 两 种 情况 ， 所 以 要 依次 对 左右 表达 式 进 行 检 查 。 如 果 左 右 都 
为 指针 类 型 ， 并 且 运 算 符 不 为 -= ， 则 这 种 情况 属于 类 型 错误 ,会 在 TypeChecker 阶段 报错 ， 
所 以 这 里 可 以 直接 无 视 这 样 的 情况 。 

这 里 要 转换 的 内 容 是 将 整数 值 乘 上 sizeof ( 指针 指向 的 类 型 ) 。 比 起 语言 ， 用 图 来 说 明 更 
容易 理解 ， 请 参考 图 11.8。 























BinaryOpNode(+) Bin(+) 
> 
ptr 2 l | ptr Bin(*) 
left right 
Int(2) Int(4) 


图 11.8 ”对 指针 的 加 减法 的 转换 
sizeof ( 指针 指向 的 类 型 ) 用 代码 表示 为 ptrBaseSize( 指针 类 型 )。ptrBaseSize 
方法 的 返回 值 是 中 间 代 码 节 点 Int。 
至 此 BinaryOpNode 对 象 的 中 间 代 码 转 换 也 完成 了 。 
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本 节 将 讲述 MemberNode 对 象 和 ArefNode 对 象 等 可 以 赋值 的 表达 式 所 对 应 的 对 象 的 转换 。 
[FJ 左边 和 右边 
首先 ， 放 我 们 来 记 几 个 经 常 出 现 的 术语 一 一 “左边 ”“ 右 边 ”“ 左 值 ”“ 右 值 ”。 


“左边 ” “右边 ”分 别 是 指 赋值 的 左 侧 表达 式 和 右 侧 表达 式 。 例 如 下 面 这 样 的 C 语言 表达 式 ， 
i 为 左边 (LHS，Left Hand Side), 5 为 右边 (RHS, Right Hand Side )。 








i = 5; 


在 C 语言 (4Cb ) 中 ,右边 可 以 写 任意 表达 式 ， 但 左边 仅 可 以 写 可 以 赋值 的 表达 式 。 可 以 
赋值 的 表达 式 有 变量 (i) EHE (*ptr)、 数 组 (ary [1] )、 结 构 体 和 联合 体 的 成 员 
(s.memb FI p- »memb )。 

左边 的 表达 式 的 共通 特征 是 可 以 用 地 址 运算 符 ( & ) 取得 表达 式 的 地 址 。 


F3 左 值 和 右 值 
刚才 的 语句 中 ， 变 量 i 在 左边 ,但 变量 同样 可 以 写 在 右边 ， 如 下 所 示 。 




















n= i +1; 


为 了 方便 比较 ， 我 们 将 两 条 语句 并 排 写 在 下 面 。 





5; // 语句 1 
i eilg // 88] 2 

实际 上 ， 即 便 是 相同 的 字符 大 ， 写 在 左边 和 写 在 右边 时 ， 编 译 需 所 需要 的 值 是 不 一 样 的 。 
像 语句 2 这 样 将 宕 写 在 右边 的 情况 下 ， 编 译 需 会 生成 获取 变量 i 的 值 的 代码 。 但 像 语 句 1 这 样 
将 变量 写 在 左边 的 情况 下 ， 编 译 需 就 必须 生成 获取 i 的 地 址 (ei) 的 代码 。 

一 般 来 说 ， 表 达 式 x 出 现在 左边 时 表示 “x 的 地 址 ”。 相 同 的 表达 式 出 现在 右边 时 表示 
"x 的 地 址 中 的 值 *。 把 表达 式 写 在 左边 时 的 值 称 为 左 值 (1-value )， 写 在 右边 时 的 值 称 为 右 值 


( r-value )。 


i 
n 
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再 举 几 个 例子 。 请 看 如 下 语句 。 











TACEN, 
int *ptr - &n; 


Er c3 Sg // X8] 1 
return *ptr; e e 


上 述 语 句 中 ,语句 1 的 *ptt 写 在 左边 ， 因 此 作为 编译 结果 需要 计算 的 值 为 *ptt 的 左 值 ， 
即 ptr (=&n)。 男 一 方面 ,语句 2 中 的 *ptr 写 在 右边 ， 因 此 作为 编译 结果 需要 计算 的 值 为 


*ptr 的 右 值 ， 即 *ptr (23). 
综 上 ， 即 便 是 看 上 去 相同 的 表达 式 ， 写 在 左边 写 在 右边 时 的 含义 也 不 一 样 。 
































cbc 中 左 值 的 表现 


下 面 来 讲 一 下 Cb 的 实现 。 
Cb 中 能 写 在 左边 的 表达 式 有 5 种 ， 如 表 11.8 所 示 。 






























































表 11.8 左边 

表达 式 的 种 类 表达 式 示 例 AST 节点 类 

变量 引 i VariableNode 
取 值 *ptr DereferenceNode 
数组 引 ary[1] ArefNode 

成 员 引 s.memb MemberNode 
成 员 引 p-»memb PtrMemberNode 









































上 述 5 种 节点 中 ， 只 有 variableNode 节点 的 左 值 和 右 值 分 别 对 应 各 自 专 用 的 中 间 代 码 市 
点 ， 左 值 的 中 间 代 码 用 Aaa 节点 表示 ， 右 值 的 中 间 代 码 用 var 节点 表示 。 除 此 之 外 的 可 赋值 节 
点 的 左 值 的 中 间 代 码 ， 下 面 将 依次 进行 讲解 。 

简 而 言 之 ， 左 值 可 以 说 是 地 址 ， 那 么 右 值 就 是 该 地 址 上 的 值 。 例 如 ， 成 员 引 用 的 表达 式 
s.y 的 右 值 就 是 对 地 址 ss . y 的 取 值 * (es .y)。 

因此 ， 要 计算 右 值 的 中 间 代 码 ， 可 以 说 只 需 在 左 值 的 中 间 代 码 的 基础 上 增加 Mem 节点 即 
可 。 例 如 Cb 中 的 *ptr 所 对 应 的 中 间 代 码 ， 左 值 对 应 的 是 Var 节点 ， 右 值 的 话 就 是 在 左 值 的 
基础 上 增加 了 Mem 节点 的 树 (图 11.9 )。 

利用 上 述 特点 ，cbc 采用 如 下 方针 来 计算 左 值 。 

首先 ， 对 所 有 可 以 赋值 的 节点 计算 其 右 值 的 中 间 代 码 。 例 如 ， 表 示 变 量 的 VariableNode 
对 象 一 般 会 转换 成 Var 节点 。 只 有 在 赋值 的 左边 需要 左 值 时 才 进 行 特别 处 理 ， 即 增加 将 右 值 转 
换 为 左 值 的 处 理 。 将 右 值 转换 为 左 值 ， 基 本 上 都 可 以 采用 如 下 算法 。 
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源 代码 AST EE 


右 值 的 情况 







*ptr 左 值 的 情况 





<<DereferenceNode>> 
expr 


<<VariableNode>> 


图 11.9 “*ptr 对 应 的 2 个 中 间 代 码 
1. 右 值 为 Var 节点 的 话 ， 将 其 转换 为 Addr 节点 
2. 右 值 为 Mem 节点 的 话 ， 则 取出 Mem 节点 
3. 除 此 之 外 的 情况 属于 致命 错误 ( 编译 器 的 bug ) 










































































IRGenerator 类 的 addressof 方法 对 上 述 算法 进行 了 实现 。 


/多 /结构 体 成 员 的 偏 移 


接着 ， 为 了 说 明 结 构 体 成 员 Cexpr.memb) 的 转换 ， 我 们 先 来 讲 一 下 结构 体 成 员 的 地 址 计 
算 的 相关 内 容 。 

访问 结构 体 的 成 员 可 以 用 地 址 的 加 法 运算 和 指针 来 表示 。 例 如 ， 表 达 式 expr.memb 可 以 
转换 为 * (&expr + (memb 的 偏 移 ) ) 。 这 里 的 “memp 的 偏 移 ”是 指 在 内 存 中 存放 结构 体 时 元 
素 memb 的 位 置 。 

下 面 我 们 以 如 下 所 示 的 C 语言 结构 体 的 定义 为 例 ， 来 详细 地 讲 一 下 结构 体 成 员 的 偏 移 
(offset )。 





struct point [ 
Ine X; 
a wg 
Ipe Z7 


这 样 的 结构 体 point 在 内 存 中 的 布局 如 图 11.10 所 示 。 在 这 种 情况 下 ， 从 结构 体 的 起 始 位 
置 到 成 员 的 距离 (byte 数 ) 称 为 “成 员 的 偏 移 "。 例 如 x 的 偏 移 为 0，y 的 偏 移 为 4，z 的 偏 移 
为 8。 
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En 
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NM —0d0o0-Jgo9ooi »0N- O 
le ie 


图 11.10 struct point 的 内 存 布局 











根据 上 图 可 知 ， 结 构 体 的 起 始 地 址 加 上 成 员 的 偏 移 就 能 够 得 到 成 员 的 地 址 。 例 如 成 员 y 的 
地 址 可 以 通过 ( 结构 体 的 起 始 地 址 +4 ) 来 获得 。 因 此 成 员 y 的 值 就 是 对 指向 ( 结构 体 的 起 始 地 
址 +4) 的 指针 取 值 ， 这 就 是 算式 * (&expr + (memb 的 偏 移 ) ) 的 含义 。 

11.10 的 内 存 布 局 中 成 员 之 间 没 有 间 际 ,但 是 在 size 不 同 的 类 型 的 组 合 的 情况 下 ， 成 员 
之 间 就 可 能 会 产生 间 际 。 关 于 结构 体 布局 的 具体 规则 将 在 第 12 章 讲 解 。 





















































F RSA ( expr.memb ) 的 转换 

接着 就 让 我 们 来 看 一 下 具体 的 代码 。 我 们 已 经 知道 结构 体 的 成 员 可 以 转换 为 * (&expr + 
(memb 的 偏 移 ) ) 这 样 的 算式 ， 因 此 只 需要 用 中 间 代 码 的 节点 来 表示 上 述 算式 即 可 。 将 成 员 所 
对 应 的 MemberNode 转换 为 中 间 代码 的 代码 如 代码 清单 11.13 所 示 。 
代码 清单 11.13 MemberNode 的 转换 ( compiler/IRGenerator ) 











public Expr visit (MemberNode node) { 
Expr expr - addressOf (transformExpr (node.expr())); 
Expr offset = ptrdiff (node.offset()); 
Expr addr - new Bin(ptr t(), Op.ADD, expr, offset); 
return node.isLoadable() ? mem(addr, node.type()) : addr; 


) 
前 3 行 都 是 在 生成 左 值 的 中 间 代 码 。 我 们 可 以 结合 中 间 代 码 的 图 来 理解 。 例 如 S. y 这 样 
的 Cb 表达 式 会 转换 成 如 图 11.11 所 示 的 中 间 代 码 。 单 个 表达 式 所 生成 的 中 间 代 码 为 图 11.11 中 
Bin 下 方 的 树 。 
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Em 


















S.y z«MemberNode»5 
member: y 
expr 
<<Addr>> 
<<Bin>> 
entity: S ««Int»» 
图 11.11 MemberNode 对 应 的 IR 树 
代码 的 含义 如 下 。 





第 1 行 的 addqressof (transformExpr (node .expr ())) 是 在 计算 expr .memb 对 应 的 
&expr, node.expr() 是 expr 对 应 的 AST， 用 transformExpr 方法 对 其 进行 转换 后 得 到 
中 间 代 人 码 ， 再 用 addressof 方法 转换 就 能 得 到 地 址 。 

第 2 行 的 ptrdiff (node.offset ()) 是 表示 成 员 的 偏 移 的 中 间 代 码 。 以 刚才 的 struct 
point 为 例 ，y 的 偏 移 是 4。 在 这 种 情况 下 ，node .offset () 等 于 4, 通过 ptrdiff 方法 将 
其 转换 为 中 间 代 码 Int. Int 是 表示 整数 值 的 中 间 代 码 节 点 。 

最 后 ,第 3 行将 expr 和 offset 相 加 ， 生 成 中 间 代 码 Bin。Bin 的 构造 函数 的 参数 的 含 
义 如 表 11.9 所 示 。 

X119 Bin 类 的 构造 函数 的 参数 









































参数 类 型 含义 

type asm.Type 该 表达 式 的 类 型 

op Op 二 元 运算 的 种 类 

left Expr 二 元 运算 的 左 表达 式 (x+y 中 的 x) 
right Expr 二 元 运算 的 右 表达 式 (x+y 中 的 y) 





























传 给 第 1 个 参数 的 ptr_t () 是 Cb 中 指针 类 型 所 对 应 的 asm.Type， 即 asm.Type. 
INT32 ( 32bit 整数 )。 传 给 第 2 个 参数 的 op .ADD 表示 加 法 运算 。 
这 样 一 来 , 图 11.11 中 Bin 以 下 的 部 分 就 生成 了 。 


左 值 转换 的 例外 : 数组 和 函数 


接 下 来 应 该 只 需要 在 之 前 得 到 的 中 间 代 码 中 添加 Mem， 将 左 值 转换 为 右 值 就 可 以 了 。 但 实 
际 的 代码 却 令 人 难以 理解 ， 如 下 所 示 。 








return node.isLoadable() ? mem(addr, node.type()) : addr; 


上 述 代 码 其 实 是 在 对 数组 和 函数 类 型 的 表达 式 进行 特别 处 理 。 数 组 的 表达 式 和 函数 类 型 的 
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表达 式 即 使 没有 写 &， 在 处 理 时 也 必须 认为 自动 添加 了 &。 例 如 printf 指 的 是 printf 函数 
的 地 址 ， 而 并 非 变 量 printf 的 内 容 ， 即 和 sprintf 是 等 价 的 。 同 样 ， 数 组 类 型 的 变量 ary 
的 含义 是 sary [0]。 

为 了 实现 上 述 功能 ，cbc 中 只 有 在 数组 和 函数 类 型 的 表达 式 的 情况 下 始终 生成 左 值 ， 即 便 代 
BKA printf, tZ EN sprintf 同样 的 代码 。 

说 明 一 下 代码 。node .isLoadable() 在 node 对 应 的 表达 式 的 类 型 既 非 数组 也 非 范 数 时 
返回 true。 这 时 返回 mem(addqr，nodqe.type() )。mem 是 在 中 间 代 码 aaa 中 添加 Mem r 
点 的 方法 ， 具 体 的 代码 如 代码 清单 11.14 所 示 。 
代码 清单 11.14 mem 方法 ( compiler/IRGenerator.java ) 





private Mem mem (Expr expr, Type t) { 
return new Mem(asmType(t), expr); 


} 
另外 ， 当 node 对 应 的 表达 式 为 数组 或 函数 类 型 ( 即 isnoadable () 返回 false) Bj, 
就 会 直接 返回 a9dr。 这 样 对 于 数组 类 型 的 表达 式 和 函数 类 型 的 表达 式 就 生成 左 值 了 。 
在 中 间 代 码 以 及 之 后 的 阶段 ，Cb 的 类 型 信息 就 消失 了 ， 因 此 这 部 分 处 理 必须 在 中 间 代 码 转 
换 之 前 实施 。 


成 员 引 用 的 表达 式 ( ptr->memb ) 的 转换 


讲解 了 访问 成 员 的 表达 式 的 转换 之 后 ， 这 次 我 们 再 来 看 一 下 通过 “- >” 访 问 成 员 的 表达 式 
的 转换 。 对 应 节点 PtrMemberNode 的 转换 代码 如 代码 清单 11.15 所 示 。 
代码 清单 11.15 ”PtrMemberNode 的 转换 ( compiler/IRGenerator.java ) 











public Expr visit(PtrMemberNode node) { 
Expr expr - transformExpr (node.expr()); 
Expr offset = ptrdiff (node.offset()); 
Expr addr - new Bin(ptr t(), Op.ADD, expr, offset); 
return node.isLoadable() ? mem(addr, node.type()) : addr; 


) 

从 代码 上 看 ， 该 代码 和 MemberNode 的 代码 非常 相似 ， 差 别 只 有 一 处 : 第 1 行 从 
addressOf (transformExpr (node.expr())) ÆT transformExpr (node.expr()), 
即 删除 了 addressotf 的 处 理 。 

只 要 思考 一 下 “- >” 运 算 符 的 含义 ， 就 能 够 理解 为 何 有 这 样 的 差别 。 例 如 表达 式 ptr->y 
的 含义 是 “指针 变量 ptr 的 值 所 指向 的 结构 体 的 成 员 y”。 这 时 ptr 需要 的 值 是 变量 ptr 的 内 
容 ， 即 右 值 ， 而 非 变量 ptr 的 地 址 ( 左 值 )。 因 此 ,通过 transformExpr (node .expr ()) 
来 计算 ptr 的 值 ( 右 值 ) 是 正确 的 。 
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存在 副作用 的 表达 式 的 转换 








本 节 我 们 将 考虑 赋值 和 i++ 这 样 存 在 副作用 的 表达 式 的 转换 。 


表达 式 的 副作用 


先 从 什么 是 副作用 说 起 。 

副作用 (side effect) 是 指 执行 表达 式 时 ， 表 达 式 除 返 回 值 之 外 产生 的 影响 。 例 如 执行 赋值 
表达 式 ， 除 了 返回 值 之 外 ， 内 存 中 的 值 也 发 生 了 变化 。 这 里 “内 存 中 的 值 也 发 生 了 变化 ”这 样 
的 影响 就 是 副作用 。 

一 般 而 言 ， 赋 值 的 主要 目的 就 是 改变 内 存 中 的 值 ， 因 此 将 上 述 影 响 称 为 “副作用 ”可 能 让 
人 觉得 有 些 不 可 思议 。 其 实 ， 这 里 的 术语 “副作用 ”是 指 将 程序 的 含义 从 形式 上 进行 分 类 、 分 
析 ， 和 “ 药 的 副作用 ”的 用 法 是 完全 不 同 的 。 这 一 点 请 明确 。 
作用 的 典型 例子 有 赋值 和 文件 的 输入 和 输出。 在 C 语言 〈《Cb ) 中 ， 如 下 表达 式 是 有 副作用 的 。 





























2 Ñ 








型 








WARAK ( =、+=、-=、x=、 66e ) 
自 增 和 自 减 (iei. i--. --i) 
因为 函数 中 可 能 包含 这 些 表达 式 ， 也 可 能 执行 输入 输出 ， 所 以 函数 的 调用 也 可 能 存在 副作用 。 
对 制作 编译 吉 来 说 ， 存 在 副作用 的 表达 式 是 非常 难 对 付 的 。 
首先 ， 有 副作用 的 表达 式 的 执行 顺序 不 能 随意 更 改 。 例 如 ， 如 果 倒 过 来 先 执行 printEf 的 
函数 调用 ， 那 么 程序 的 结果 就 可 能 发 生变 化 。 在 程序 的 优化 过 程 中 ， 替 换 表 达 式 的 执行 顺序 、 
提取 共通 的 表达 式 等 操作 能 起 到 很 好 的 效果 ， 而 有 副作用 的 表达 式 会 对 优化 产生 很 大 的 限制 。 
另外 ， 即 便 只 有 一 个 有 副作用 的 表达 式 ， 也 会 对 其 他 表达 式 的 结果 产生 影响 。 例 如 ， 如 果 
执行 了 修改 临时 变量 的 值 的 表达 式 ， 那 么 在 此 之 后 所 有 用 到 该 临时 变量 的 表达 式 的 结果 都 会 发 
生变 化 。 因 此 存在 副作用 的 表达 式 周 围 的 表达 式 也 不 能 随意 更 改 顺 序 。 
所 以 说 副作用 对 编译 需 来 说 是 一 个 非常 环 手 的 问题 。 


[FJ 有 副作用 的 表达 式 的 转换 方针 
下 面 来 说 一 下 cbe 中 是 如 何 转换 有 副作用 的 表达 式 的 。 
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cbe 的 中 间 代 码 仪 按照 语句 的 执行 顺序 来 表示 副作用 的 发 生 顺 序 。 也 就 是 说 ， 只 要 严格 按照 
语句 的 顺序 执行 ， 就 能 够 确保 产生 副作用 的 正确 性 ， 这 一 点 是 在 生成 中 间 代 码 时 必须 做 到 的 。 

存在 副作用 的 cbe 中 间 代 码 有 两 种 : 赋值 所 对 应 的 Assign 和 函数 调用 所 对 应 的 Callo 

Assign 类 是 stmt 类 的 子 类 ， 因 此 可 以 单独 成 为 语句 。 男 外 ， 因 为 在 表达 式 之 中 不 能 有 









































制 。call 只 能 用 于 如 图 11.12 所 示 的 场景 。 


CD ExprStmt 的 下 方 

















赋值 ， 所 以 Assign 是 赋值 操作 中 唯一 会 产生 副作用 的 语句 。 
男 一 方面 ， 执 行 函数 调用 的 Call 是 Expr 类 的 子 类 ， 可 以 使 用 call 的 场所 有 着 严格 的 限 





(2) Assign 的 右边 的 下 方 


< 

1142 Call 的 使 用 方法 

至 今 为 止 我 们 所 涉及 的 节点 都 只 转换 为 单个 Expr， 有 副作用 的 表达 式 就 并 非 这 样 。 有 副 作 

用 的 表达 式 必 须 同 时 生成 使 副作用 发 生 的 stmt 和 返回 值 的 Expr。 但 visit 方法 只 能 返回 一 
个 Expr， 因 此 就 需要 处 理 剩 余 的 Stmt 的 方法 。cbc 中 通过 向 IRGenerator 类 的 private 





属性 stmts 设置 Stmt 对 象 来 解决 上 述 问题 。 


简单 赋值 表达 式 的 转换 (1) 语句 














接着 让 我 们 看 一 下 具体 的 节点 转换 处 理 。 先 从 最 简单 的 赋值 表达 式 的 转换 讲 起 。 赋 值 表达 
X (x=y ) 对 应 的 AssignNode 的 转换 代码 如 代码 清单 11.16 所 示 。 
代码 清单 11.16 AssignNode 的 转换 ( compiler/IRGenerator.java ) 


public Expr visit(AssignNode node) ( 





Location lloc = node.lhs().location(); 
Location rloc = node.rhs().location(); 
if (isStatement()) { 


// Evaluate RHS before LHS. 


Expr rhs - transformExpr (node.rhs()); 
assign(lloc, transformExpr (node.lhs()), 


return null; 

} 

else { 
// lhs = rhs -> tmp 
DefinedVariable tmp 


fhg, Ihs s tmp, 
tmpVar (node.rhs().type()); 


rhs); 


tmp 


assign(rloc, ref(tmp), transformExpr (node.rhs())); 


assign(lloc, transformExpr (node.lhs()), 


return ref (tmp); 


ref (tmp) ) ; 
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赋值 表达 式 作 为 其 他 表达 式 的 一 部 分 使 用 时 其 返回 值 才 有 意义 ， 作 为 单独 的 语句 使 用 时 表 
达 式 的 返回 值 没 有 意义 。 因 此 一 开始 就 用 isStatement 方法 判断 表达 式 是 否 为 独立 的 语句 ， 
并 根据 判断 结果 分 别 生成 最 合适 的 中 间 代 码 。 

首先 来 看 then 部 分 ， 即 赋值 表达 式 作 为 语句 单独 出 现时 的 情况 。 这 部 分 的 代码 如 下 所 示 。 





Expr rhs - transformExpr (node.rhs()); 
assign(lloc, transformExpr (node.lhs()), rhs); 


第 1 条 语句 调用 trans£formExpr 方法 将 赋值 的 右边 (node .rns () ) 转换 为 中 间 代 码 。 
同样 ， 第 2 条 语句 在 转换 赋值 的 左边 (node .1lhs () ) 的 同时 用 assign 方法 将 Assign 节点 
设置 到 stmts 属性 中 。assign 方法 的 实现 如 下 所 示 。 
代码 清单 11.17 assign 方法 ( compiler/IRGenerator.java ) 








private void assign(Location loc, Expr lhs, Expr rhs) { 
stmts.add (new Assign(loc, addressOf(1lhs), rhs)); 


) 




















assign 方 法 的 实现 一 看 就 能 明白 ,但 需要 注意 的 是 对 于 左边 的 中 间 代 码 这 里 调用 了 
addressof 方法 。 如 前 所 述 ，transformExpr 生成 的 是 右 值 的 中 间 代 码 ， 例 如 对 于 引用 变 
量 的 表达 式 ， 返回 的 应 该 是 表示 变量 的 值 的 中 间 代 码 。 所 以 这 里 要 使 用 addressof 方法 , 将 
其 转换 为 左 值 所 对 应 的 中 间 代 码 。 


m 临时 变量 的 引入 
接着 来 看 一 下 赋值 表达 式 出 现在 其 他 表达 式 之 中 的 情况 。 相 应 的 代码 如 下 所 示 。 














DefinedVariable tmp = tmpVar(node.rhs().type()); 
assign(rloc, ref(tmp), transformExpr (node.rhs())); 
assign(lloc, transformExpr (node.lhs()), ref(tmp)); 
return ref (tmp); 


这 里 出 现 了 新 方法 tmpVar。tmpVar 是 生成 新 的 临时 变量 的 方法 。tmpvVar 生成 的 临时 
变量 和 转换 中 的 表达 式 有 相同 的 作用 域 , 但 名 称 不 同 于 任何 已 有 的 变量 。 如 果 用 cbe 命令 的 -- 
dump-ir 选项 来 显示 中 间 代 码 的 话 ， 会 被 表示 为 etmpNNN (NNN 为 连续 的 id )。 

利用 临时 变量 对 原来 的 Cb 语句 进行 变形 ， 就 能 够 将 表达 式 的 求 值 作用 和 副作用 清晰 地 分 
开 ， 生 成 容易 分 析 (= 容易 编译 ) 的 中 间 代 码 。 

上 述 赋值 表达 式 可 以 通过 将 右边 的 值 赋 给 临时 变量 来 分 开 赋值 和 返回 表达 式 的 值 的 作用 。 
例如 ， 试 着 考虑 如 下 Cb 语句 。 















































alode, abs 
f£(isg(7)); 
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函数 £ 和 g EDI int 类 型 的 值 为 参数 ， 并 返回 inc 类 型 的 值 。 上 述 Cb 语句 一 边 为 变量 i 
赋值 ， 一 边 把 变量 作为 参数 传 给 函数 £。 即 使 像 下面 这 样 改 写 上 述 语 句 ， 程 序 的 结果 也 不 会 发 
生变 化 。 





这 就 是 从 刚才 的 代码 转换 而 来 的 。 
另外 ， 还 要 注意 不 能 转换 为 下 面 这 样 的 代码 。 





ele alp 
L BS Ge 
1 (31) 5 


即使 用 2 次 左 表达 式 i 的 方法 。 上 述 例 子 的 左边 只 是 简单 的 变量 引用 ， 因 此 无 论 执 行 几 次 ， 
除了 性 能 以 外 都 不 会 有 别 的 问题 。 但 一 般 情况 下 ， 多 次 执行 左边 的 话 会 产生 问题 。 原 因 在 于 左 
表达 式 中 可 能 包含 有 副作用 的 表达 式 。 例 如 ， 试 着 考虑 下 面 这 样 的 语句 。 











f(*ptree- - g(7)); 


上 述 语句 执行 2 次 左边 的 *ptr++ 的 话 程序 的 结果 会 发 生变 化 。 但 如 果 按 照 第 1 种 方法 进 
行 转换 ， 如 下 所 示 ， 程 序 的 结果 不 变 。 


ine emp = 
ioe c ENSS 
f(tmp); 


简单 赋值 表达 式 的 转换 (2) 表达 式 


既然 已 经 理解 了 利用 临时 变量 进行 转换 的 相关 内 容 ， 让 我 们 回 到 赋值 表达 式 的 转换 。 再 来 
看 一 下 对 应 的 代码 。 





DefinedVariable tmp = tmpVar(node.rhs().type()); 
assign(rloc, ref(tmp), transformExpr (node.rhs())); 
assign(lloc, transformExpr (node.lhs()), ref(tmp)); 
return ref (tmp); 


上 述 代码 所 做 的 是 如 下 所 示 的 转换 ， 请 在 理解 这 一 点 的 基础 上 再 试 着 读 代码 。 


























seme (tins :hs En el En Mic rr Emp) 


这 里 出 现 了 名 为 cont 的 函数 调用 ， 它 的 含义 是 “使 用 了 赋值 表达 式 的 值 的 任意 表达 式 ”。 当 
前 的 前 提 条 件 是 在 其 他 表达 式 中 使 用 赋值 表达 式 的 值 ， 因 此 姑且 用 函数 调用 作为 “其 他 表达 式 ”。 
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首先 ， 在 第 1 行 中 调用 tmpVaz 方法 生成 临时 变量 。tmpVar 方法 的 参数 为 所 生成 的 变量 
的 类 型 。 

接着 ,在 第 2 行 用 transformExpr 方法 将 右边 转换 为 中 间 代 码 ， 并 用 assign 方法 将 赋 
值 语 句 设 置 到 stmts 属性 中 。assign 的 第 2 个 参数 中 的 ref 是 返回 引用 变量 的 中 间 代 码 var 
的 方法 。 也 就 是 说 ， 在 第 2 行 生 成 将 右边 的 值 赋 给 临时 变量 的 语句 。 

在 第 3 行 用 transformExpr 方法 将 左边 转换 为 中 间 代 码 ， 并 将 临时 变量 的 值 赋 给 它 。 

最 后 ， 在 第 4 行 返回 引用 临时 变量 的 表达 式 ， 这 样 转换 就 结束 了 。 








anno 
pan 
Ii 


4 





这 里 我 们 来 讲 一 个 小 知识 。 先 来 看 下 面 一 行 代码 ， 这 是 刚才 出 现 的 赋值 表达 式 的 转换 。 


onis = rns nee Mehr Mi hs tno eont ene 

















如 前 所 述 ，cont 不 仅 限 于 函数 调用 ， 可 以 是 任何 使 用 赋值 表达 式 的 值 的 表达 式 。 例 如 
return、++， 其 至 是 10 层 瞪 套 的 函数 调用 也 没有 问题 。 更 抽象 地 说 ，cont 可 以 是 任何 操作 ， 可 
以 将 其 考虑 为 “赋值 表达 式 之 后 执行 的 程序 全 体 "。 
举例 来 说 明 。 假 设 main 调用 函数 a， 函数 a 调用 函数 pb， 函数 b 调用 函数 c，c 中 执行 语句 
return (lhs = zhs) ;。 赋 值 表 达 式 执行 之 后 ， 从 函数 c 返回 rhs 的 值 ， 再 执行 函数 b 剩余 部 
分 ， 然 后 执行 函数 a 剩余 部 分 ， 然 后 执行 main 函数 剩余 部 分 ， 程 序 结束 。 任 何 表达 式 都 可 以 理解 
为 是 按照 “在 此 之 后 执行 ~ ， 之 后 再 执行 ~ ”这 样 的 上 下 文 (context) 来 执行 的 。 

这 样 的 上 下 文 称 为 续 延 ( continuation )。 在 刚才 的 表达 式 中 ，cont 就 是 续 延 的 略称 。 





































































































































































































后 置 自 增 的 转换 


让 我 们 再 来 看 一 个 有 副作用 的 表达 式 转 换 的 例子 ， 即 后 置 自 增 (expr++ ) 的 转换 代码 。 后 
置 自 增 所 对 应 的 SuffixopNode 的 转换 代码 如 代码 清单 11.18 所 示 。 
代码 清单 11.18 ”SuffixOpNode 的 转换 ( compiler/IRGenerator.java ) 


public Expr visit(SuffixOpNode node) { 
Expr expr - transformExpr (node.expr()); 
Type t = node.expr().type(); 
Op op = binOp(node.operator()); 
Location loc = node.location(); 











if (isStatement()) { 
// expre*; -> expr += 1; 
transformOpAssign(loc, op, t, expr, imm(t, 1)); 
return null; 























11.6 B 在 副 作 
else if (expr.isVar()) { 
// cont (expr++) -> v = expr; expr = v + 1; cont(v) 
DefinedVariable v - tmpVar(t); 
assign(loc, ref(v), expr); 
assign(loc, expr, bin(op, t, ref(v), imm(t, 1))); 
return ref(v); 
} 
else ( 
// cont (expr++) -> a = &expr; v = *a; *a = *a + 1; cont(v) 
DefinedVariable a = tmpVar(pointerTo(t)); 
DefinedVariable v - tmpVar(t); 
assign(loc, ref(a), addressOf(expr)); 
assign(loc, ref(v), mem(a)); 
assign(loc, mem(a), bin(op, t, mem(a), imm(t, 1))); 


return ref(v); 


) 
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Su£fixopNode 的 转换 代码 和 我 们 已 经 介绍 过 的 代码 相 比 长 了 不 少 。 因 为 相 
分 成 了 3 种 模式 进行 转换 ， 所 以 看 上 去 比较 长 ， 实 际 上 没什么 好 怕 的 。 此 方法 的 
{ 


public Expr visit(SuffixOpNode node) 


















































共通 的 处 理 ; 
if (单独 的 语句 的 情况 下 ) { 
将 i++ 视 作 i += 1 进行 转换 ; 
} 
else if (左边 是 单纯 的 变量 引用 的 情况 下 ) { 
cont (expre MM cvm M MEME TOES) 
) 
else ( 
contesspui ML MCN M cp UE Ecc CM MEE IE MEDI 


} 
} 


其 中 ,第 2 部 分 是 性 能 优化 的 处 理 ， 因 此 我 们 只 来 读 一 下 
头 的 共通 部 分 和 第 3 部 分 ， 如 下 所 示 。 


E 


HH 





Expr expr transformExpr (node.expr()); 


Type t - node.expr().type(); 
Op op - binOp (node.operator()); 
Location loc - node.location(); 


tmpVar (pointerTo(t)); 
tmpVar (t); 


DefinedVariable a 
DefinedVariable v 


assign(loc, ref(a), addressOf (expr)); 
assign(loc, ref(v), mem(a)); 
assign(loc, mem(a), bin(op, t, mem(a), imm(t, 1))); 


return ref(v); 


R 据 表达 式 的 形式 
概要 如 下 所 示 。 


通用 的 第 3 WAT. cR RTT 




















一 开始 的 4 行 仅仅 是 为 了 使 代码 更 整洁 而 进行 的 定义 。 即 便 不 使 月 
同 的 表达 式 ， 程 序 的 含义 也 不 会 发 生变 化 。 
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空 行 之 后 就 是 转换 的 本 体 。 首 先 定 义 了 2 个 临时 变量 :a 是 存放 左边 的 地 址 的 变量 ，v 是 存 
放 右 边 的 值 的 变量 。 

接着 使 用 3 次 assign 方法 进行 转换 。 

第 1 个 assign 方 法 用 transformExpr 方法 将 expr++ 中 的 expr 部 分 转换 为 中 间 代 
人 码 ， 并 将 它 的 地 址 赋值 给 临时 变量 ao 

第 2 个 assign 方法 将 指针 a 所 指向 的 值 赋 给 临时 变量 vo 

第 3 个 assign 方法 对 指针 a 所 指 问 的 值 实施 自 增 或 自 减 。 这 里 出 现 的 bin 是 生成 Bin 
节点 的 方法 。 

如 果 node.expr () 的 表达 式 的 类 型 为 指针 的 话 ，bin 方法 就 需要 为 右 值 乘 上 指针 所 指向 
类 型 的 size。 例 如 转换 ptr++ 这 样 的 表达 式 ， 并 且 变 量 ptr 的 类 型 为 tntx* ， 那 么 就 需要 加 上 
l*sizeof (int). 

DPE EB AXAXUMPPHRUEADR T. BRA RMH ERARI Fe e — 7 BTE RI [8] 
题 ， 但 通过 引入 临时 变量 ， 生 成 中 间 代 码 就 容易 处 理 得 多 了 。 为 了 便于 之 后 的 优化 操作 以 及 代 
码 生 成 ， 在 中 间 代 码 转换 阶段 进行 这 些 处 理 是 非常 重要 的 。 
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本 章 将 介绍 x86 系列 CPU 的 历史 以 及 架构 。 


12.4. 计算 机 的 系统 结构 
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计算 机 的 系统 结构 














本 章 之 前 的 内 容 讲解 了 Cb 的 语法 和 语义 分 析 。 之 后 只 要 根据 分 析 的 结果 生成 机 需 语 言 ， 就 能 
将 Cb 的 程序 编译 成 机 器 语言 了 。 为 了 将 程序 正确 地 转换 为 机 器 语言 ， 首 先 必须 要 理解 机 器 语言 。 

机 稀 语 言 是 直接 操作 计算 机 硬件 的 语言 ， 因 此 如 果 不 懂 硬 件 的 相关 知识 ， 就 无 法 理解 机 带 
语言 。 用 Java 来 打 比 方 ， 就 相当 于 如 果 不 知道 对 象 的 性 质 就 无 法 理解 Java。 不 理解 语言 所 操作 
的 对 象 ， 只 知道 语言 本 身 ， 这 是 不 可 能 的 。 

因此 本 节 先 对 计算 机 系统 的 基本 架构 进行 讲解 。 


CPU 和 存储 器 


从 物理 角度 来 看 ， 计 算 机 的 中 心 是 总 线 (bus )。 总 线 是 传送 数据 的 通信 干线 ， 它 连接 了 计 
算 机 中 的 各 个 设备 ( device )， 使 通信 成 为 可 能 。 

总 线 所 连接 的 设备 中 最 重要 的 是 CPU ( Central Processing 总 线 
Unit) 和 存储 器 (memory), CPU 是 实际 负责 运算 的 设备 ， 而 存 
储 器 是 存储 二 进 制 数据 ( 字 节 ) 的 设备 。 无 论 什 么 样 的 计算 机 都 ”图 12.1 简化 的 计算 机 系统 架构 
一 定 会 有 这 两 个 设备 ， 如 图 12.1 所 示 。 

计算 机 开机 后 CPU 就 开始 运行 ， 根 据 存储 器 中 存储 的 代码 来 改变 存储 器 的 内 容 。 简 单 来 
说 ， 计 算 机 的 体系 架构 就 是 仅 此 而 已 。 虽 然 看 似 简单 ， 但 计算 机 却 可 以 处 理 文本 、 图 像 、 声 音 
等 各 种 数据 ， 提 供 实 用 的 功能 ， 这 就 是 计算 机 的 厉害 之 处 。 


F3 寄存 器 


CPU 的 内 部 设 有 名 称 为 寄存 器 (register ) 的 容量 非常 小 的 存储 器 。 寄 存 器 的 大 小 有 32 位 
(bit) 或 64 f, TE CPU 进行 计算 时 ， 寄 存 需 被 用 于 临 
时 存放 数据 。 通 常 ，CPU 先 将 数据 从 存储 器 读 入 寄存 
器 ， 然 后 以 寄存 器 为 对 象 进行 计算 ， 再 将 计算 结果 写 siis 
回 存储 器 。 将 数据 从 存储 器 读 和 人 寄存 器 的 操作 称 为 加 

载 (load )， 将 数据 从 寄存 器 写 回 存储 器 的 操作 称 为 写 
[El (store )。 请 结合 图 12.2 来 把 握 这 些 概念 。 12.2 ”寄存 器 
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地 址 

































































无 论 是 从 存储 器 〈 到 寄存 器 ) 读 取 数据 还 是 写 入 0x0 
Jis, pu t EMT NE a A EREE o MAR " 0x1 
计算 机 中 使 用 称 为 地 址 (address ) 的 编号 来 访问 存 加 载 地 址 3 上 [6 0x2 
AHF o 的 数据 0x3 

Jb AER RTI 4 ROBUR T. (isse 0x4 








始 ( 第 1 个 字 节 ) 地 址 为 0， 第 2 个 字 节 的 地 址 为 1， | 
第 3 个 字 节 的 地 址 为 2…… 以 此 类 推 。 通 过 指定 这 个 编 
号 ， 就 能 够 对 存储 器 进行 读 写 (图 12.3 )。 

请 记 住地 址 0 也 可 以 称 为 “0 号 地 址 ”或 “0 地 址 ”。 


jy 图 12.3 ”使 用 地 址 访问 存储 器 
物理 地 址 和 虚拟 地 址 


至 此 我 们 所 讲 的 都 是 硬件 层面 的 话题 。 和 OS 相关 的 话题 会 变 得 稍微 复杂 一 些 。 

在 现代 OS 中 ， 多 个 程序 ( 进程 ) 同时 运行 ， 即 物理 层面 上 单一 的 存储 器 必须 被 多 个 进程 
共同 使 用 。 
这 时 如 果 根 据 进程 来 区 分 可 用 的 地 址 ， 那 么 程序 的 编写 就 会 变 得 非常 麻烦 。 因 为 这 样 程序 
的 整体 就 无 法 使 用 绝对 地 址 ， 无 法 使 用 绝对 地 址 就 不 得 不 逐一 根据 相对 位 置 来 计算 地 址 ， 非 常 
WEB, HERF. 

在 可 以 同时 和 运行 多 道 进程 的 现代 计算 机 中 , 在 CPU 和 OS 的 协作 下 ， 所 有 的 进程 看 上 去 都 
可 以 使 用 从 0 地 址 开始 的 独立 的 存储 器 地 址 。 也 就 是 说 ， 虽 然 从 0 地 址 开始 的 存储 器 实际 上 只 
有 一 个 ， 但 各 个 进程 看 上 去 可 以 独占 这 片 存储 顺 〈 图 12.4 )。 


虚拟 地 址 
Ox0 OxFFFFFFFF Ox0 OxFFFFFFFF Ox0 OxFFFFFFFF 
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0x0 OxFFFFFFFF 


物理 地 址 


12.4 ”物理 地 址 和 虚拟 地 址 


此 时 进程 所 使 用 的 地 址 称 为 虚拟 地 址 (virtual address )。 而 物理 存储 器 的 实际 的 地 址 称 为 物 
理 地 址 (physical address )。 另 外 ， 虚 拟 地 址 的 整体 范围 称 为 程序 的 地 址 空间 (address space ). 
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具体 来 说 ， 这 种 使 进程 看 上 去 独占 存储 器 的 机 制 是 下 面 这 样 的 。 首 先 ， 将 物理 存储 器 分 割 
为 大 小 为 4 KB 或 8 KB 的 单位 ， 这 样 的 单位 称 为 页 ( page )。 接 着 ， 当 进程 需要 内 存 时 ，OS 会 
将 新 的 页 分 配给 进程 ， 并 将 此 页 的 虚拟 地 址 和 物理 地 址 的 对 应 关系 记录 到 OS 管理 的 “地 址 转 
换 表 ” 中 。 之 后 就 是 CPU 的 工作 了 。 进 程 使 用 虚拟 地 址 访问 存储 器 时 ，CPU 内 部 称 为 MMU 
( Memory Management Unit ) 的 设备 会 访问 地 址 转换 表 进 行 地 址 转换 ( 图 12.5 )。 

















虚拟 地 址 
Ox0  OxFFFFFFFF Ox0 OxFFFFFFFF 0x0 ”0OxFFFFFFFF 
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MMU 进行 地 址 转换 
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存储 器 


0x0 OxFFFFFFFF 


图 12.5 地址 的 转换 


C 语言 的 指针 就 是 保存 虚拟 地 址 的 数据 类 型 。 例 如 将 整数 15000 强制 转换 为 char* 类 型 并 
访问 ， 就 能 够 得 到 该 进程 的 地 址 空间 中 15000 地 址 上 的 值 。 


F3 各 类 设 
实际 上 ， 计 算 机 中 除 CPU 和 存储 器 之 外 还 有 很 多 其 他 的 设备 。 例 如 硬盘 、DVD-ROM、 显 


示 器 、 连 接 显 示 器 用 的 显卡 、 网 络 通信 用 的 网 卡 等 。 
和 CPU 以 及 存储 需 一 样 ， 这 些 设 备 都 是 通过 总 线 连接 的 ， 如 图 12.6 所 示 。 
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网 卡 以 太 网 集线器 、 路 由 器 


图 12.6 连接 在 总 线 上 的 设备 
CPU 通过 总 线 传输 信和 号 来 控制 其 他 设备 ， 比 如 可 以 向 磁盘 读 取 或 写 信 数据， 也 可 以 向 图 形 
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卡 发 送 图 像 数 据 并 在 显示 需 上 显示 。 
在 图 12.6 中 ,存储 器 和 其 他 设备 并 排 连接 在 一 条 总 线 上 。 这 方面 的 结构 根据 计算 机 的 种 类 
和 年 代 的 不 同 ， 有 很 大 的 区 别 。 例 如 ， 现 代 计 算 机 的 典型 架构 如 图 12.7 所 示 。 























键盘 


127 ”当前 典型 的 基于 Intel CPU 的 计算 机 架构 
可 能 只 有 编写 OS 的 人 员 才 需要 理解 连接 设备 的 总 线 的 形状 差异 。 在 本 书 的 范围 内 ， 只 要 
理解 设备 是 通过 某 种 形式 的 总 线 相连 接 ， 并 通过 总 线 收发 命令 和 数据 就 足够 了 。 


缓存 

和 其 他 设备 相 比 ，CPU 的 运行 速度 提升 得 很 快 ， 现 代 的 CPU 和 其 他 设备 之 间 已 经 有 着 数 
十 倍 至 数 万 倍 的 速度 差 。 尽 管 如 此 ，CPU 还 是 要 和 其 他 设备 进行 协作 ， 在 和 其 他 设备 进行 交互 
时 ，CPU 不 得 不 等 待 其 他 设备 处 理 结束 。 也 就 是 说 ， 有 时 可 能 CPU 完全 游 丸 有余 ， 但 却 被 其 他 
设备 拖 了 后 腿 ， 导 致 速度 变 慢 。 

在 这 为 数 众多 的 设备 中 ,存储器 特别 容易 因为 和 CPU 的 时 钟 频 率 差 而 产生 问题 。 正 如 本 章 
开头 所 讲 的 那样 ，CPU 和 存储 器 是 计算 机 中 的 核心 设备 。 无 论 CPU DR, TEE OSEE 
跟 不 上 的 话 ， 计 算 机 整体 的 速度 就 无 法 提升 。 

为 了 克服 存储 器 速度 缓慢 的 问题 ， 人 们 进行 了 各 种 各 样 的 尝试 ， 其 中 的 一 个 方法 就 是 “ 存 
储 融 的 层次 化 ”。 

其 实 存储 器 也 分 不 同 的 种 类 ， 有 高 速 的 也 有 低速 的 ， 履 盖 范 围 很 广 。 如 果 所 有 的 存储 器 都 
采用 高 速 存储 器 的 话 就 不 会 有 任何 问题 ， 但 高 速 存储 器 价格 昂贵 。 现 在 的 计算 机 一 般 都 有 1 GB 
到 2 GB 的 内 存 ， 如 果 这 1 GB 都 采用 高 速 存储 器 的 话 ， 计 算 机 的 售 价 将 远 远 超 过 当前 价格 。 

因此 就 出 现 了 缓存 (cache memory ) 的 机 制 (图 12.8 )。 首 先 ， 提 供 大 量 低速 且 廉 价 的 存储 
器 。 这 是 基本 的 存储 锅 ， 称 为 “ 主 存储 器 "。 另 一 方面 ， 配 备 少许 高 速 且 高 价 的 存储 器 ， 这 就 是 
“缓存 "。 通 常 从 主 存储 器 获取 数据 ， 获 取 1 次 数据 后 A n ( 进行 缓存 )。 这 
样 再 次 访问 相同 的 数据 时 就 只 需 访 问 高 速 缓存 即 可 ， 因 此 CPU 就 能 够 持续 地 高 速 运行 。 
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CPU 
中 一 开始 从 主 存储 器 (2) 第 二 次 直接 从 缓存 
加 载 数据 ， 并 将 数 | 加 载 ， 无 需 访 问 主 
据 缓存 在 缓存 中 。 存储 器 。 














图 12.8 缓存 的 机 制 





当然 缓存 的 容量 比 主 存储 器 小 得 多 ， 所 以 无 法 将 所 有 加 载 的 数据 都 放置 在 缓存 中 。 当 缓存 
写 满 后 就 必须 选取 适当 的 数据 丢弃 ， 写 人 新 的 数据 。 

这 样 的 缓存 机 制 在 大 多 数 程序 上 都 能 起 到 很 好 的 作用 。 因 为 大 多 数 程序 都 有 短 时 间 内 集中 
访问 存储 器 的 特定 区 域 这 样 的 特性 。 也 就 是 说 ， 访 问 过 一 次 的 数据 ， 随 即 被 再 次 使 用 的 可 能 
很 高 。 因 此 即便 高 速 存 储 器 的 容量 小 ， 但 是 只 要 有 缓存 ， 就 能 够 大 大 提升 计算 机 的 整体 速度 。 
9 
f. 存储 器 的 层次 














最 近 CPU 的 缓存 机 制 变 得 越 来 越 复杂 ， 如 今 仅 用 一 级 
缓存 已 经 无 法 填补 CPU 和 主 存储 器 之 间 的 速度 差 ， 因 此 出 
现 了 采用 多 级 缓存 逐渐 填补 速度 差 的 机 制 。 如 图 12.9 所 示 。 

像 这 样 ， 缓 存 可 以 有 多 层 ， 从 离 CPU 近 的 开始 依次 称 
73 L1 缓存 ( L1 cache, level 1 cache ), L2 缓存 ( L2 cache, 
level 2 cache ), 这样 的 存储 器 结构 称 为 分 级 存储 器 体系 
( memory hierarchy )。 

现在 在 售 的 计算 机 至 少 都 应 该 配备 了 2 级 缓存 ， 一 些 


昂贵 的 计算 机 中 还 配备 了 3 级 缓存 。 








CPU 





















































主 存储 器 





12.9 存储 器 的 层次 
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x86 系列 CPU 的 历史 





本 节 将 简单 介绍 现代 计算 机 普遍 使 用 的 x86 系列 CPU 的 历史 。 


x86 系列 CPU 








现代 计算 机 所 使 用 的 CPU 大 致 都 是 x86 系列 CPU (x86 CPU) WEZ, Pentium ( £155 II, 
证 、4、D )、Celeron、Core、Xeon、Athlon、Phenom、Opteron， 这 些 都 属于 x86 系列 CPU, 

x86 系列 CPU 的 原型 是 Intel 公司 于 1978 年 推出 的 型 号 为 8086 的 CPU。“x86” 中 的 “86” 
即 8086 中 的 86。 从 8086 到 Intel 最 近 推 出 的 Core i7 为 止 ， 出 现 了 很 多 x86 系列 CPU。 表 12.1 
中 列举 了 Intel 主要 的 CPU。 
表 12.1 x86 系列 CPU 




































































































































































































































































CPU 名 发 布 时 间 特征 

8086 978 Intel 首 款 16 位 CPU 

80186 1982 在 8086 的 基础 上 增加 了 外 围 的 1C 电路 的 CPU 

80286 1982 在 80186 的 基础 上 增加 了 系统 保护 功能 的 CPU 

386 1985 x86 系列 首 款 32 位 CPU 

486 1989 32 位 CPU, M 486DX 开始 增加 了 浮 点 数 运算 单元 

Pentium 1993 较 486 速度 大 幅 提 升 

MMX Pentium | 1997 在 Pentium 的 基础 上 增加 了 MMX 指令 

Pentium Pro 1995 内 部 结构 向 RISC 靠拢 ， 大 幅 提 升 了 32 位 指令 速度 

Pentium || 1997 在 Pentium Pro 的 基础 上 增加 了 MMX 指令 

Pentium iii 1999 在 Pentium | 的 基础 上 增加 了 SSE 指令 

Pentium 4 2000 在 Pentium iii 的 基础 上 增加 了 SSE2 指令 和 SSE3 指令 。 后 期 还 出 现 了 64 位 的 CPU 

Pentium M 2003 继承 了 Pentium iii 的 内 部 架构 的 移动 CPU。32 位 CPU 

Core 2006 沿用 Pentium M 的 架构 的 双核 CPU ( 但 Core Solo 还 是 单 核 的 )。32 位 CPU 

Core 2 2006 Core 的 增强 版 。64 位 CPU 

Core i7 2008 Core 2 的 增强 版 ， 并 内 置 了 内 存 控制 器 。64 位 CPU 

REI CPU 之 外 ，Intel 还 发 布 了 用 于 服务 器 的 名 为 Xeon 的 CPU. Xeon 根据 发 布 时 期 的 

不 同 ， 其 自身 的 架构 也 不 一 样 ， 一 般 是 在 当时 桌面 版 CPU 的 基础 上 增加 了 对 多 CPU 的 支持 等 。 
32 位 CPU 





在 这 么 多 的 CPU 之 中 ， 特 别 具 有 里 程 碑 意义 的 要 数 386 fll Pentium4 了 。386 是 x86 系列 的 
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第 一 款 32 位 CPU， 后 期 的 Pentium 4 Æ Intel 的 x86 系列 第 一 款 64 位 CPU。 实 际 上 “x x 位 
CPU” 的 定义 比较 模糊 ， 但 至 少 要 满足 下 面 这 2 个 条 件 才 能 真正 地 被 称 为 “n 位 CPU”。 




















1. 具备 n 位 宽 的 通用 寄存 器 

2. 具备 n 位 以 上 的 地 址 空间 

“通用 寄存 器 ”是 寄存 器 中 用 于 整数 运算 等 的 通用 的 寄存 器 。32 位 CPU 的 通用 寄存 器 的 大 
小 为 32 位 ，64 位 CPU 的 话 为 64 位 。 

关于 另 一 个 条 件 中 的 “地 址 空间 ”本 章 已 经 讲解 过 了 。 地 址 空间 是 指 进程 虚拟 地 址 的 全 体 
范围 。 更 直 白 一 些 的 话 ， 可 以 说 成 是 C 语言 的 指针 可 以 访问 地 址 的 范围 。 

最 近 的 CPU 中 ,通用 寄存 带 的 大 小 就 是 指针 的 大 小 ， 指 针 能 够 指向 的 范围 也 和 地 址 空间 相 
一 致 。 即 “32 位 CPU” 的 通用 寄存 器 的 大 小 为 32 位 ， 和 指针 的 大 小 相同 ， 地 址 空间 为 无 符号 
32 位 整数 能 够 指向 的 范围 。 同 样 地 ,“64 位 CPU” 的 通用 寄存 器 的 大 小 也 是 64 位 ， 和 指针 大 
小 相同 ， 地 址 空间 为 无 符号 64 位 整数 能 够 指向 的 范围 。 

不 过 严谨 地 讲 ，x86 系列 CPU 只 要 使 用 PAE (Physical Address Extension ) 这 样 的 机 制 ，32 
位 的 CPU 也 可 以 操作 36 位 范围 的 地 址 空间 。 但 这 终究 只 是 应 用 于 OS 的 机 制 ， 一 般 进 程 中 可 
操作 的 地 址 空间 仍旧 是 32 位 数值 的 范围 。 本 书 原则 上 不 涉及 OS 内 部 的 机 制 ， 因 此 还 是 将 32 
位 CPU 的 地 址 空间 当 作 32 位 整数 的 范围 来 考虑 。 


指令 集 

如 前 所 述 ， 仅 32 位 的 CPU 来 说 ，Intel 就 有 很 多 不 同 种 类 的 产品 。 在 这 多 种 多 样 的 CPU 
之 间 ， 速 度 以 及 内 部 的 架构 都 有 很 大 的 区 别 。 例 如 最 初 的 32 位 CPU 386 和 最 新 的 Core 2 相 
比较 ， 时 钟 频 率 上 有 着 100 倍 左 右 的 差距 ， 缓 存 的 容量 以 及 层次 也 截然 不 同 。386 原本 就 没有 
缓存 。 

尽管 有 着 这 样 的 差异 ， 一 般 386 和 Core 2 都 可 以 统称 为 “x86 系列 CPU”。 这 是 因为 386 
和 Core 2 能 够 执行 相同 的 机 器 语言 的 指令 。 如 果 是 只 使 用 386 的 指令 编写 的 程序 ， 那 么 在 386、 
486, Pentium, Core 2 上 都 同样 能 够 执行 。 像 这 样 不 同 的 CPU 都 能 够 解释 的 机 器 语言 的 体系 称 
为 指令 集 架 构 (ISA, Instruction Set Architecture )， 也 可 以 简称 为 指令 集 (instruction set )。 

拿 编 程 语 言 来 说 ， 指 令 集 架构 就 像 语言 的 规范 。 即 便 是 不 同 公司 提供 的 编译 器 ， 只 要 是 根 
据 同样 的 语言 规范 实现 的 ， 那 么 相同 代码 的 运行 结果 就 应 该 是 相同 的 。 例 如 无 论 是 Sun 的 Java 
VM 还 是 IBM 的 Java VM, if 语句 的 执行 动作 都 是 相同 的 。 尽 管 如 此 ， 各 个 生产 商 的 编译 器 的 
内 部 结构 可 能 完全 不 同 。 

上 今 集 架构 也 和 语言 的 规范 一 样 。 相 同 指 令 集 架构 的 CPU， 无 论 速 度 或 实现 有 着 怎样 的 差 
异 ， 相 同 的 程序 都 能 够 同样 地 执行 。 
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Intel 将 x86 系列 CPU 之 中 的 32 位 CPU 的 指令 集 架 构 称 为 IA-32。IA Æ “Intel Architecture" 
的 简称 。 


1A-32 的 变迁 


刚才 提 到 了 “如 果 是 只 使 用 386 的 指令 编写 的 程序 ， 那 么 无 论 在 什么 CPU 上 都 同样 能 够 
执行 "。 请 注意 这 里 说 的 并 非 “ 使 用 IA-32 的 指令 编写 的 …… ”而 是 “只 使 用 386 的 指令 编写 
的 ……” 实 际 上 ， 即 便 是 同属 于 IA-32 的 CPU， 越 是 后 期 推出 的 CPU， 所 支持 的 指令 也 越 多 。 
因此 针对 老 款 CPU 编写 的 程序 能 够 在 新 的 CPU 上 运行 ， 但 反 过 来 就 未 必 可 以 了 。 

IA-32 中 包含 的 指令 增加 得 非常 厉害 ， 几 乎 所 有 的 产品 升级 都 会 添加 新 的 指令 。 下 面 就 介绍 
一 些 其 中 特别 重要 的 指令 。 

首先 ，486 中 增加 了 非常 重要 的 指令 。 从 486 的 486DX 型 号 开始 加 入 了 浮 点 数 运 算 单 元 
(FPU, Floating Point number Processing Unit )， 文 持 浮 点 数 运 算 。486DX 所 支持 的 浮 点 数 运算 

间 令 称 为 x87 FPU 指令 ( x87 FPU instructions )。 

386 也 能 够 文 持 浮 点 数 运算 , 但 必须 男 外 配备 名 为 387 的 FPU。 也 就 是 说 ， 配 备 有 387 的 
VL as RIA Bode 387 的 机 需 可 用 的 指令 是 不 一 样 的 。 为 此 ， 至 今 Linux 内 核 中 还 留 有 是 否 文 持 
WA FPU 的 386 的 编译 选项 。 

所 添加 的 其 他 重要 的 指令 还 有 MMX 和 SSE (Streaming SIMD Extensions )。 两 者 都 是 为 了 
并 行 处 理 多 条 数据 的 扩展 指令 。 例 如 ， 用 通常 的 IA-32 指令 进行 加 法 运算 时 ， 一 次 只 能 执行 
回 加 法 运算 。 但 使 用 MMX 或 SSE 的 加 法 指令 就 能 同时 执行 多 个 运算 。 也 就 是 说 ,在 a 和 b fH 
加 的 同时 ， 还 能 计算 c A d 的 相 加 。 由 此 可 见 ， 只 要 用 好 MMX 或 SSE， 运算 速 度 就 应 该 能 达 
到 原来 的 2 fA E; MMX 主要 用 于 整数 的 并 行 处 理 ，SSE 主要 用 于 浮 点 数 的 并 行 处 理 。 

顺便 提 一 下 ， 当 时 MMX 是 multimedia extension 的 简称 。 但 最 近 多 媒体 (multimedia ) 这 个 
词 显 得 有 些 过 时 了 ，Intel 也 声称 MMX 并 非 任何 词 的 简称 。 


























































































































IA-32 的 64 位 扩展 一 AMD64 


x86 系列 CPU 原本 是 由 Intel 设计 并 生产 的 ， 但 现在 除 Intel 以 外 ， 也 有 数 家 公司 生产 兼容 
IA-32 的 CPU， 其 中 特别 重要 的 兼容 CPU 生产 商 就 是 AMD。 

之 所 以 说 AMD 重要 ， 是 因为 AMD 先 于 Intel 提出 了 x86 系列 的 64 位 扩展 ， 并 推出 了 相 
应 的 产品 。 由 AMD 设计 的 x86 系列 的 64 位 指令 集 架 构 称 为 AMD64。AMD 推出 的 Athlon64 , 
Phenom, Opteron 这 几 款 CPU 都 是 基于 AMD64 的 指令 集 架 构 。 

被 AMD 后 来 居 上 的 Intel 在 一 番 争 论 之 后 ,在 自己 的 CPU 中 加 入 了 和 AMD64 几乎 相同 的 
名 为 Intel 64 的 指令 集 。Pentium 4 后 期 的 版 本 和 Core 2 的 后 续 产 品 ， 以 及 最 近 的 Xeon 都 是 基 
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于 Intel 64 指令 集 架 构 的 。 

要 统称 AMD64 和 Intel 64 时 ， 也 可 使 用 独立 于 公司 名 字 的 用 语 x86-64。 男 外 ，Windows 
中 将 AMD64 对 应 的 架构 称 为 x64。 

像 这 样 ，x86 系列 CPU 的 64 位 扩展 的 名 字 有 多 种 ， 实 在 容易 混淆 。 本 书 中 为 了 向 先 提 出 
x86 的 64 位 扩展 方案 的 AMD 致敬 ， 将 其 统称 为 AMD64。 原 本 cbe 就 是 IA-32 用 的 编译 器 ， 所 
以 今后 AMD64 也 几乎 不 会 出 现 。 

更 容易 混淆 的 还 有 Intel 和 HP 一 起 开发 的 名 为 1A-64 的 指令 集 架 构 。IA-64 虽然 名 字 和 
IA-32 相似 ， 其 实 和 IA-32 架构 完全 不 兼容 。Intel 推出 的 Itanium 处 理 器 是 基于 IA-64 架构 的 ， 
Core 2 和 Xeon 都 不 是 IA-64 架构 。 









































本 市 我 们 来 了 解 一 下 IA-32 的 概要 。 


|A-32 的 寄存 器 


IA-32 的 CPU 中 有 很 多 寄存 器 ， 但 程序 实际 可 使 用 的 寄存 器 有 着 一 定 的 限制 。IA-32 PE 
要 的 一 些 寄存 器 如 图 12.10 所 示 。 
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图 12.40 1IA-32 的 主要 寄存 器 
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让 我 们 按 顺 序 来 看 一 下 。 

通用 寄存 器 ( generic register ) 是 编程 时 使 用 频率 最 高 的 寄存 器 。 宽 度 为 32 位 的 通用 寄存 器 
有 eax, ebx, ecx, edx, esi, edi, esp, ebp 共 8 个 ， 用 于 整数 运算 和 指针 处 理 。 

肯 令 指针 (instruction pointer ) 是 存放 下 一 条 要 执行 的 代码 的 地 址 的 寄存 器 ， 用 于 代码 的 读 
取 和 控制 。IA-32 的 指令 指针 的 宽度 为 32 位 ， 称 为 eip。 

标志 寄存 器 (flag register) 是 用 于 保存 CPU 的 运行 模式 以 及 表示 运算 状态 等 的 标志 的 寄存 
需 。IA-32 的 标志 寄存 顺 为 32 位 宽 ， 称 为 eflags。 

浮 点 数 寄存 器 (floating point number register )， 顾 名 思 义 ， 是 存放 浮 点 数 的 寄存 器 ， 用 于 浮 
点 数 的 运算 。IA-32 中 从 st0 到 st7， 有 8 个 宽度 为 80 位 的 浮 点 数 寄存 器 。 

MMX 寄存 器 ( MMX register ) 是 MMX 指令 用 的 寄存 咒 。MMX Pentium 以 及 Pentium II ZZ 
后 的 CPU 中 有 从 mmo 到 mm7 共 8 个 64 位 的 寄存 器 。 但 实际 上 MMX 寄存 器 和 泽 点 数 寄 存 器 
是 共用 的 ， 即 无 法 同时 使 用 浮 点 数 寄存 器 和 MMX 寄存 器 。 

最 后 ，XMM 寄存 器 (XMM register ) 是 SSE SWIATA Pentium iii 以 及 之 后 的 CPU 
中 提供 了 xmm0 到 xmmy7 共 8 个 128 位 宽 的 XMM 寄存 器 。XMM 寄存 器 和 MMX 寄存 器 不 同 ， 
是 独立 的 寄存 器 ， 不 和 浮 点 数 寄存 絮 共用 。 男 外 ，mxcsr 寄存 器 ( mxcsr register ) 是 表示 SSE 
指令 的 运算 状态 的 寄存 器 。 

除 上 述 这 些 寄存 器 之 外 ， 还 有 写 OS 内 核 时 使 用 的 系统 寄存 器 (system register), debug 时 
使 用 的 debug 寄存 器 ( debug register) 以 及 32 位 环境 下 用 不 到 的 段 寄存 器 (segment register )。 
详细 内 容 请 参考 IA-32 相关 的 参考 手册 ?。 

接着 我 们 详细 了 解 一 下 通用 寄存 器 和 指令 指针 的 作用 。 


FJ 通用 寄存 器 
通用 寄存 器 (generic register ) 是 编程 时 使 用 频率 最 高 的 寄存 局， 用 于 整数 运算 和 指针 处 理 。 


X 12.2 中 列举 了 IA-32 的 通用 寄存 器 。 
表 12.2 1A-32 的 通用 寄存 器 
































































































































寄存 器 名 名 称 的 由 来 

eax accumulator 

ebx base register 
ecx count register 
edx data register 

esi source index 

edi destination index 
ebp base pointer 

esp stack pointer 











(D Intel 655-25 A- JW : http://www.intel.com/products/processor/manuals/ ; 
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虽说 是 通用 寄存 咒 ， 但 实际 上 ebp AIAN esp 寄存 器 的 
作用 基本 上 是 固定 的 。 这 两 个 寄存 器 分 别称 为 frame pointer 
和 stack pointer， 用 于 操作 机 器 栈 ( machine stack )。 机 需 栈 
的 相关 内 容 将 稍 后 讲解 。 

ebp 寄存 器 和 esp 寄存 器 之 外 的 6 个 寄存 器 原则 上 可 以 
随意 使 用 。 通 向 用 这 6 个 寄存 器 进行 整数 运算 、 计 算 地 址 
以 及 访问 内 存 。 

另外 ， 通 用 寄存 需 的 宽度 都 为 32 位， 也 可 以 将 它 的 
一 部 分 当 作 16 位 或 8 位 的 寄存 器 来 使 用 。 可 以 将 此 视 作 

C 语言 中 联合 体 的 机 制 。 例 如 ， idi eax 寄存 器 的 低 16 

位 当 作 16 位 宽 的 寄存 器 ax 来 访问 。 进 一 步 说 ， 还 可 以 将 
ax 寄存 器 的 高 8 位 作为 ah 寄存 器 ， 8 位 作为 al Sif d 
来 使 用 。 
我 们 将 这 样 的 通用 寄存 器 的 别名 总 结 在 图 12.11 中 。 


机 器 栈 


这 里 讲 一 下 机 带 栈 的 相关 内 容 。 
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图 12.41 通用 寄存 器 


作为 数据 结构 的 栈 (stack ) 想必 大 家 都 知道 。 Ge rie UNDA n IA-32 中 各 进 























程 地 址 空间 的 一 部 分 被 作为 栈 使 用 ， 主 要 用 于 保存 函数 的 临时 变量 和 参数 。 这 个 特殊 的 栈 通 
Mes “ 栈 ”"， 为 了 避免 混淆 ， 本 书 中 决定 将 其 称 为 机 絮 栈 。 
器 栈 的 位 置 因 OS 而 异 。 在 IA-32 的 Linux 平台 上 ， 机 器 栈 位 于 各 进程 的 地 址 空间 中 靠 














sk 








ur 


近 3 GB Ab, [5] O 地 址 方向 延伸 。 即 机 融 栈 是 从 靠 后 的 地 址 向 前 进行 延伸 。 图 12.12 中 描绘 了 











IA-32 的 机 带 栈 ， 请 结合 图 片 把 握 大 化 的 印象 。 








( 暂 定 地 址 保存 在 ESP 中 


0x0 
栈 延 伸 的 方向 
OxBFEF8000 栈 顶 
栈 底 
OxBFFODOOO 


图 12.12. Linux/IA-32 的 机 器 栈 
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IA-32 中 用 栈 指针 (stack pointer) 来 表示 机 器 栈 。 栈 指针 (esp 寄存 器 ) 是 存放 机 器 栈 栈 顶 
地 址 的 寄存 顺 。 换 言 之 就 是 通过 将 机 需 栈 的 栈 项 地 址 存放 在 esp 寄存 天 中 并 不 断 延 什 ， 由 此 来 
ALS o 


机 器 栈 的 操作 


假设 我 们 要 向 机 器 栈 压 4 字 节 的 整数 17。 将 esp 寄存 器 减 4 来 延伸 机 器 栈 ， 然 后 将 整数 保 
存 到 esp 寄存 器 所 指向 的 地 址 中 (图 12.13 )。 




















esp 





图 12.13 ”向 机 器 栈 压 栈 


从 机 噩 栈 将 数据 弹出 栈 时 执行 压 栈 的 逆向 操作 。 也 就 是 说 ， 加 载 esp 寄存 絮 所 指向 的 地 址 
上 的 数据 之 后 ， 增 加 esp 寄存 器 的 值 〈 缩减 机 顺 栈 ) 


sp esp 








图 12.14 ”从 机 器 栈 出 栈 


请 注意 AI-32 的 机 器 栈 是 向 0 地 址 延伸 的 ， 因 此 增加 esp 寄存 器 的 值 相 当 于 “缩减 机 器 栈 ”。 
相反 ， 如 果 要 延伸 机 融 栈 ， 则 需要 减少 esp。 


[Fi 机 器 栈 的 用 途 
说 起 机 器 栈 的 用 途 ， 可 以 想到 的 有 “运算 过 程 中 作为 存放 临时 数据 的 场所 使 用 ”等 。 
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由 于 实际 上 esp 和 ebp 的 用 途 是 固定 的 ，IA-32 中 通用 寄存 器 的 数量 并 非 8 个 ， 通 常 整数 运 
算 等 可 用 的 寄存 器 数量 为 6 个 或 者 更 少 ， 因 此 必须 同时 保存 超过 6 个 的 数据 才能 进行 运算 ， 像 
下 面 这 样 的 表达 式 就 无 法 利用 通用 寄存 需 进 行 运算 。 


























((( eu / lu) / (eu / cuy) / (tert / zn) / (eu w / 
(DL / ga) f (eL / 3X3») f (wu / iub) / (eu / qpuy»»» / 
((((mm 71m» / (Gm / c2») / (B / 29) / (sp / i) / 
((qum 7 g9» / (QS / XE») f (mm Js) / (eB / 595)))) / 
(9 9) / («em Js) (ES / 59) / CE y SII / 
(Ca / 39» / (9 / 39»» / (us / ms) / (eS / I / 
((((a4 / b4) / (c4 / d4)) / ((e4 / £4) / (g4 / h4))) / 
(((i14 / 34) / (k4 / 14)) / ((m4 / n4) / (o4 / p4))))) 


几乎 不 会 有 人 故意 写 如 此 宛 长 的 表达 式 , 但 其 他 表达 式 使 用 的 临时 变量 也 会 占用 寄存 器 ， 
这 样 原 本 可 用 的 寄存 器 的 数量 就 会 减少 ， 因 此 即便 是 很 简单 的 表达 式 ， 也 可 能 发 生 寄存 器 不 够 
的 情况 。 

这 时 就 要 使 用 机 器 栈 。 将 计算 过 程 中 的 数据 压 到 机 器 栈 中 就 能 够 腾 出 空 的 寄存 器 ， 这 样 即 
使 项 再 多 的 表达 式 也 都 能 够 计算 。 计 算 结束 后 ， 将 中 间 数 据 出 栈 ， 恢 复 栈 的 原样 即 可 。 

顺便 介绍 下 ，IA-32 以 外 的 架构 ， 特 别 是 被 称 为 RISC 类 型 的 架构 中 ， 寄 存 需 的 数量 要 多 
得 多 ， 一般 仅仅 是 通用 寄存 器 就 有 32 个 以 上 。 例 如 名 为 MIPS 架构 的 CPU 就 有 32 个 通用 寄存 
器 。x86 系列 的 AMD64 中 通用 寄存 器 的 数量 也 已 经 增加 到 16 个 ， 因 此 寄存 器 的 使 用 也 变 得 更 
为 方便 。 


ED 

机 和 需 栈 并 不 是 连续 的 一 整 块 。C 语言 程序 是 通过 连续 的 函数 调用 来 执行 的 ， 因 此 机 器 栈 也 
是 根据 每 一 个 函数 分 开 进 行 管理 的 。 这 时 我 们 将 管理 C 语言 中 单个 函数 数据 的 机 需 栈 的 领域 称 
为 栈 帧 〈 stack frame )。 

例如 ， 我 们 试 着 想 一 下 从 main KAH KZŽ E, i 
从 函数 ££ 调用 函数 g 这 样 的 程序 。 该 程序 在 执行 函数 g 
时 的 机 器 栈 如 图 12.15 所 示 。 

Linux/IA-32 中 的 基 址 指针 (base pointer )， 即 ebp 寄 
存 需 ， 总 是 指向 现在 执行 中 的 函数 的 栈 帧 的 底部 。 栈 帧 
的 顶部 和 机 顺 栈 的 顶部 是 相同 的 ， 因 此 esp 指向 的 是 栈 
帧 的 顶部。 由 这 2 个 寄存 器 构成 了 机 需 栈 和 栈 帧 。 

其 他 架构 中 一 般 将 具有 和 基 址 指针 相同 功能 的 指针 BHEHS. UN 
称 为 帧 指针 ( frame pointer )。 因 此 gee 的 帮助 以 及 选项 中 经 常 可 以 见 到 frame pointer 这 个 名 字 。 

1 个 栈 帧 中 保存 着 如 下 这 些 信息 。 
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e | 临时 变量 
e 源 函数 执行 中 的 代码 地 址 ( 返回 地 址 ) 
e 函数 的 参数 
在 每 个 栈 帧 上 存储 上 述 信 息 的 具体 步骤 是 由 函数 的 调用 约定 (calling convention ) 决定 的 。 
各 个 CPU 架构 、 操 作 系 统 的 函数 调用 约定 各 不 相同 。 
IA-32 中 的 函数 调用 约定 粗略 地 说 有 cdecl, stdcall, fastcall 这 3 种 。Linux/IA-32 中 所 使 用 


的 调用 约定 是 cdecl。 这 些 调 用 约定 将 在 第 14 章 详细 说 明 。 


指令 指针 

接着 让 我 们 回 到 原来 的 话题 ， 来 了 解 一 下 指令 指针 Ceip 寄存 器 ) 的 相关 内 容 。 

指令 指针 (instruction pointer ) 是 存放 接 下 来 要 执行 的 代码 的 地 址 的 寄存 器 。CPU 从 该 寄 
存 器 所 指向 的 地 址 读 取 下 一 条 指令 并 执行 ， 与 此 同时 将 指令 指针 推进 到 下 一 条 指令 (图 12.16 )。 
CPU 就 是 通过 不 断 重 复 这 样 的 操作 来 执行 程序 的 。 
























































图 12.16 ”指令 指针 的 机 制 
可 以 通过 跳 转 指令 来 改变 指令 指针 的 值 ， 借 此 就 能 够 执行 代码 的 其 他 部 分 。C 语言 的 if£ 语 
^i], while 语句 以 及 goto 语句 都 是 利用 跳 转 指令 来 实现 的 。 
根据 架构 的 不 同 ， 有 时 也 将 指令 指针 称 为 程序 计数 器 ( program counter，pc )。gcc 的 帮助 
中 所 使 用 的 就 是 上 述 叫 法 ， 因 此 可 以 记 一 下 。 


FJ 标志 寄存 器 
最 后 具体 讲 一 下 标志 寄存 器 eflags。eflags 是 32 MAJATA, CPU 的 运行 模式 以 及 运算 相 
关 的 信息 等 都 以 1 个 bit 的 标志 位 的 形式 保存 在 eflags 中 。 表 12.3 中 列举 了 eflags 中 的 标志 。 
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表 12.3 eflags 寄存 器 中 的 标志 

简称 种 类 标志 的 正式 名 称 
CF status carry flag 

PF status parity flag 

AF status auxiliary carry flag 
ZF status zero flag 

SF status sign flag 

OF status overflow flag 

DF control direction flag 

TF system trap flag 

IF system interrupt flag 

IOPL system I/O privilege level 
NT system nested task 

RF system resume flag 

VM system virtual 8086 mode 
AC system alignment check 
VIF system virtual interrupt flag 
VIP system virtual interrupt pending 
ID system ID flag 

标志 有 以 下 3 类 。 











1. 表示 运算 结果 的 状态 标志 ( status flag ) 
2. 用 于 控制 运算 的 控制 标志 ( control flag ) 


3. 用 于 控制 计算 机 整体 运行 的 系统 标志 ( 





























system flag ) 






















































































D 


不 会 


这 些 标志 之 中 ， 一 般 的 程序 可 用 的 只 有 状态 标志 和 控制 标志 。 系 统 标志 在 写 OS 的 内 核 时 
会 用 到 。 用 户 模式 下 的 进程 不 能 修改 系统 标志 ， 否 则 会 因为 没有 访问 权限 而 报错 。 本 书 
用 到 控制 标志 ， 因 此 实际 用 到 的 只 有 状态 标志 。 
状态 标志 的 A EU E ri 义 如 表 12.4 所 示 o 
表 12.4 ”状态 标志 
简称 标志 的 正式 名 称 含义 
CF carry flag 运算 结果 中 发 生 进位 或 借 位 
PF parity flag 运算 结果 的 奇偶 标志 位 
AF auxiliary carry flag 运算 结果 中 低 4 位 向 高 4 位 发 生 进位 或 借 位 
ZF zero flag BRERA 0 的 时 候 被 置 为 1 
SF sign flag 运算 结果 为 负数 时 被 置 为 1 
OF overflow flag 运算 结果 越过 了 正 / 负 的 界限 
这 些 标志 位 一 般 和 跳 转 指 令 组 合 使 用 。 跳 转 指 令 的 相关 内 容 将 在 第 13 章 讲解 。 
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数据 的 表现 形式 和 格式 








本 市 将 对 1A-32 中 使 用 的 数据 的 表现 形式 以 及 在 内 存 上 的 配置 规则 进行 讲解 。 


[F3 无 符号 整数 的 表现 形式 


首先 从 无 符号 整数 的 表现 形式 开始 说 起 。 

无 符号 整数 直接 使 用 二 进 制 的 表现 形式 。 例 如 十 进 制 数 137 用 二 进 制 表示 的 话 为 10001001 , 
因此 计算 机 内 部 用 与 二 进 制 对 应 的 位 (bit ) 来 表示 。 例 如 32 位 无 符号 整数 的 表现 形式 如 图 
12.17 所 示 。 











MSB LSB 
32 0 

















用 二 进 制 表示 的 数据 
图 12.17 无 符号 整数 的 二 进 制 表现 形式 


图 中 的 MSB 和 LSB 分 别 表示 最 高 位 和 最 低位 。MSB ( Most Significant Bit ) 指向 最 高 位 
( 最 高 位 对 应 的 bit), LSB (Least Significant Bit) 指向 最 低位 ( 最 低位 对 应 的 bit )。 


F3 有 符号 整数 的 表现 形式 














接着 讲 一 下 有 符号 整数 的 表现 形式 。32 位 有 符号 整数 的 表现 形式 如 图 12.18 所 示 ， 请 看 图 12.18。 


MSB LSB 
32 0 























图 12.18 有 符号 整数 的 二 进 制 表现 形式 


有 符号 整数 的 MSB 用 于 表示 符号 ， 因 此 称 为 符号 位 (sign bit )。 符 号 位 为 0 表示 正 数 ， 为 
1 表示 负数 。 
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剩余 的 位 ， 正 数 的 情况 下 直接 存放 二 进 制 形式 的 数据 ， 负 数 的 情况 下 存放 数据 的 绝对 值 的 
二 进 制 补 码 (2’s complement )。 
下 面 介绍 一 下 二 进 制 补 码 。 


FJ 负 整数 的 表现 形式 和 二 进 制 补 码 
二 进 制 补 码 的 计算 步骤 如 下 所 示 。 


1. 用 二 进 制 来 表示 数据 
2. 按 位 取 反 
3. Jn 1 

例如 ， 求 数值 3 的 8 位 二 进 制 补 码 时 ， 步 又 如 图 12.19 所 示 。 


00000011 GD 用 二 进 制 表示 数值 3 












































- 


111100 DRAR 





=i 


111101  QJn1 
图 12.19 3 的 二 进 制 补 码 


即 11111101 是 数值 3 的 二 进 制 补 码 。 现 在 大 多 数 计算 机 中 都 用 此 方式 来 表现 -3。 用 二 进 制 
补 码 表现 负数 的 好 处 在 于 ， 在 比较 数据 大 小 以 及 进行 加 减 运 算 时 可 以 将 符号 位 和 数值 域 统一 
处 理 。 

一 些 数 值 的 二 进 制 补 码 如 表 12.5 所 示 。 


表 12.5 一 些 数值 的 二 进 制 补 码 ( 宽度 都 为 8 位 ) 
| 十进制 数值 三 进 制 补 码 
1111111 
1110 
110 
1100 
101 
1010 
100 
1000 
6 110000 
32 100000 
64 000000 
128 10000000 


请 注意 11111101 是 3 的 二 进 制 补 码 ， 而 并 非 -3 的 二 进 制 补 码 。 负 数 n 的 二 进 制 表现 形式 















































s s s s s 
F R R a F 











>I OINI, AIN 
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H “n 的 绝对 值 的 三 进 制 补 码 ”。 例 如 -3 的 二 进 制 表现 形式 为 -3 的 绝对 值 3 的 二 进 制 补 码 。 


字 节 序 

32 位 ， 即 4 个 字 节 的 数据 ， 存 储 在 内 存 上 也 会 占用 4 个 字 节 。 此 时 至 于 先 放置 MSB 所 在 
的 字 节 还 是 先 放置 LSB 所 在 的 字 节 ， 是 由 CPU 的 类 型 决定 的 。 一 般 将 先 存放 MSB 所 在 字 节 的 
架构 称 为 大 端 (big endian )， 将 先 存放 LSB 所 在 字 节 的 架构 称 为 小 端 (little endian )。 

例如 将 长 度 为 4 的 char 类 型 的 数组 强行 当 作 1 个 int 类 型 的 数据 来 读 取 ， 在 写 这 样 的 代码 
时 ， 使 用 大 端的 架构 和 使 用 小 端的 架构 会 得 到 不 同 的 结果 ， 如 图 12.20 所 示 。 
































内 存 上 的 布局 
下 加 区 区 
在 大 端的 CPU 上 作为 在 小 端的 CPU 上 作为 
4 字 节 的 整数 读 取 4 字 节 的 整数 读 取 
pe] ee 
0x01020304 = 16909060 0x04030201 = 67305985 


图 12.20 ”大 端 和 小 端 


对 于 人 类 来 说 大 端 在 意思 上 更 自然 。 通 过 网 络 传输 超过 2 个 字 节 的 数据 时 使 用 大 端的 方式 
被 认为 是 比较 标准 的 做 法 ， 因 此 大 端 也 被 称 为 网 络 字 节 序 (network byte order )。 

另 一 方面 ， 在 制作 小 端 数字 电路 时 使 用 小 端的 方式 相对 人 简单， 因此 小 端的 CPU 占 大 多 数 。 
IA-32 也 属于 小 端的 架构 。 

另外 ， 近 期 设计 的 CPU 之 中 有 些 还 可 以 在 大 端 和 小 端 之 间 切 换 ， 比 如 PowerPC 和 ARM 等 。 


对 齐 

将 数据 存放 在 内 存 上 时 ， 对 于 存放 数据 的 地 址 有 对 齐 的 限制 。 

对 齐 (alignment ) 是 指 将 数据 存放 在 内 存 上 时 ， 必 须 放 置 在 特定 数值 的 倍数 的 地 址 上 。 例 
如 , “必须 放置 在 4 的 倍数 的 地 址 上 ”这 样 的 限制 就 是 4 字 节 对 齐 限制 。 男 外 ,“ 在 n 字 节 的 倍 
数 的 地 址 上 存放 数据 ”还 可 以 表述 为 “以 n 字 节 为 边界 排列 ”。 

最 近 设 计 的 CPU 中 有 着 所 有 的 数据 都 必须 放置 在 该 数据 大 小 的 倍数 的 地 址 上 这 样 的 限制 。 
也 就 是 说 ，2 字 节 的 数据 必须 放 在 2 的 倍数 的 地 址 上 ，4 字 节 的 数据 必须 放置 在 4 的 倍数 的 地 址 
上 。 换 言 之 ，2 字 节 的 数据 必须 以 2 字 节 为 边界 排列 ，4 字 节 的 数据 必须 以 4 字 节 为 边界 排列 。 
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违反 上 述 限 制 就 会 发 后 总 线 错 误 (bus error )， 导 致 程序 异常 终止 。 总 线 错 误 中 的 “总 线 ” 就 是 
12.1 节 中 介绍 过 的 “总 线 ”。 

但 是 IA-32 的 CPU 并 非 “ 最 近 设计 的 ”， 因 此 即便 不 对 齐 也 只 是 影响 速度 而 已 。IA-32 中 必 
须 考 虑 对 齐 的 情况 仅 限于 之 后 会 介绍 的 结构 体 和 压 栈 的 数据 。 

IA-32 中 栈 上 的 数据 必须 以 4 字 节 为 边界 排列 。 另 外 ， 某 些 OS 中 调用 外 部 函数 时 的 栈 帧 必 
须 以 16 字 节 为 边界 排列 ， 例 如 Windows 和 Max OS X 就 是 这 样 的 OS 的 例子 。 


结构 体 的 表现 形式 


将 结构 体 存 放 在 内 存 上 时 ， 其 成 员 的 值 在 内 存 上 由 前 向 后 依次 排列 。 也 就 是 说 ， 下 面 这 样 
的 结构 体 point 在 内 存 上 的 布局 如 图 12.21 所 示 。 























struct point [ 
int xX; 
BENI 


ha 





12.21 struct point 类 型 的 数据 的 布局 


另外 ， 此 时 对 于 各 成 员 有 着 和 各 成 员 的 数据 类 型 的 大 小 一 样 的 对 齐 限 制 。 即 2 字 节 的 数据 
必须 以 2 字 节 为 边界 排列 ，4 字 节 的 数据 必须 以 4 字 节 为 边界 排列 。 

这 样 一 来 ， 像 下 面 这 样 大 小 不 一 的 成 员 在 排列 时 就 可 能 形成 间 际 ， 如 图 12.22 所 示 。 这 样 
的 间隙 称 为 填充 (padding )。 











struct s ( 
char a; 
echarlo, 
int s 
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12.22 struct s 类 型 数据 的 布局 


像 这 样 ， 简 单 的 C 语言 表述 的 背后 有 着 各 种 各 样 复杂 的 限制 和 规则 。 代 替 程 序 员 应 对 这 样 
的 限制 也 是 编译 絮 重 要 的 职责 之 一 。 








x86 汇编 器 编程 


本 章 将 讲解 使 用 GNU 汇编 器 的 汇编 编程 。 
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基于 GNU 汇编 器 的 编程 





本 节 将 介绍 GNU 汇编 器 的 使 月 

















FJ GNU 汇编 器 


方法 。 





一 般 来 说 ，UNIX 的 C 编译 需 将 C 语言 代码 转换 为 汇 多 
处 理 ， 得 到 目标 文件 (object file )。 之 所 以 用 汇编 语言 作为 转换 中 介 ， 
判 数据 组 成 ， 比 起 能 以 文本 形式 表述 的 汇编 语言 ， 可 读 性 方面 要 差 了 很 多 。 
译 融 输出 汇编 语言 的 代码 。 汇 编 





读 。 机 咒语 言 由 二 进 外 
cbe 沿用 UNIX 的 人 做法， 其 









































语言 代码 ， 汇 编 语言 再 经 过 汇编 右 
是 因为 机 絮语 言 难以 阅 












































器 选用 Linux 上 广泛 使 用 的 














GNU as, GNU as 由 GNU 提供 ， 包 含 在 名 为 binutils 的 包 下 。gcc 所 使 用 的 汇编 器 也 是 GNU aso 


本 章 中 先 介绍 GNU as 的 使 用 方法 以 及 语法 ， 接 着 对 IA-32 的 运算 命令 进行 ; 














解 。 





汇编 语言 的 Hello, World! 





让 我 们 先 来 看 一 下 汇编 语言 是 























门 怎样 的 语言 。 在 gcc 命令 后 加 上 - 8 选项 编译 C 语言 程 














序 ， 编 译 融 就 会 在 将 C 语言 程序 转换 为 汇编 语言 后 结束 人 处理 。 输 出 文件 的 文件 名 和 原来 相同 ， 
扩展 名 由 .c 变 为 了 .s。 


输出 Hello, World! 的 C 语言 程序 hello.c 经 过 命令 


cc -S -Os 处 理 后 生成 的 汇编 语言 





g 
代码 hello. s 如 代码 清单 13.1 所 示 。 其 中 选项 -os 是 对 目标 文件 的 大 小 进行 优化 的 标志 。 


代码 清单 13.1 


.file 


.Section 


"hello.c" 


.rodata. 


.String "Hello, World!" 


.text 
.globl main 
‚type 
main: 
leal 
andl 
pushl 
pushl 
movl 
pushl 


main, Gfunction 
4 (%esp), $ecx 
$-16, 
-4 (Secx) 
%ebp 


%esp 


Sesp, %ebp 


Secx 


hello.c 的 编译 结果 ( hello.s ) 


Strl1.1,"aMS",Gprogbits,1 
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subl $16, %esp 

pushl SLO 

call puts 

movil -4(Sebp), $ecx 

xorl teax, %eax 

leave 

leal -4(Secx), %esp 

ret 

.Size main, .-main 

.ident  "GCC: (GNU) 4.1.2 20061115 (prerelease) (Debian 4.1.1-21)" 
.Section .note.GNU-stack,"",Gprogbits 





这 样 便 得 到 了 看 起 来 和 C 语言 或 者 Java THEE ECXC B TL R TES js BU RR REZ 
处 ， 很 多 地 方 都 难以 用 三 言 两 语 解释 清楚 ， 所 以 刚 接触 时 会 觉得 相当 头疼 。 虽 然 如 此 ， 好 在 重 
要 的 代码 并 不 多 ， 所 以 不 用 害怕 ， 让 我 们 继续 看 下 去 。 


基于 GNU 汇编 器 的 汇编 代码 


既然 已 经 生成 了 汇编 语言 代码 ， 让 我 们 试 着 用 汇编 器 来 编译 一 下 。 运 行 如 下 as 命令 ， 对 汇 
编 代 码 hello. s 进行 编译 。 



























































$ as hello.s 


处 理 正常 结束 后 会 生成 目标 文件 。 默 认 的 输出 文件 名 为 a .out。 可 以 使 用 file 命令 来 确 
认 目 标 文 件 是 否 正确 生成 。 








$ file a.out 
a.out: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped 





因为 显示 了 ELF…… relocatable， 所 以 可 以 确定 目标 文件 已 经 成 功 生成 。 
还 可 以 通过 -o 选项 指定 输出 的 文件 名 。 例 如 ， 乔 望 编译 hello.s 并 输出 名 为 hello.o 
的 目标 文件 时 ， 如 下 使 用 -o 选项 即 可 。 





$ as -o hello.o hello.s 
$ file hello.o 
hello.o: ELF 32-bit LSB relocatable, Intel 80386, version 1 (SYSV), not stripped 


这 样 便 正 确 生 成 hello.o 文件 了 。 
仅 生 成 目标 文件 还 不 能 作为 程序 运行 。 既 然 已 经 生成 了 目标 文件 ， 让 我 们 试 着 进行 链接 ， 生 
成 可 以 运行 的 程序 。 进 行 链接 最 简单 的 方法 如 下 ， 将 目标 文件 作为 参数 传递 给 gcc 命令 即 可 。 











$ gcc hello.o -o hello 





这 样 就 能 把 hello.o 和 C 语言 的 标准 库 进行 链接 ， 生 成 可 以 运行 的 文件 nello。 最 后 让 
我 们 来 试 着 运行 下 刚 生成 的 hello 命令 。 
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$ ./hello 
Hello, World! 


lil EBrzR, hello 命令 能 够 正常 运行 了 。 
下 一 节 我 们 将 介绍 汇编 语言 的 语法 。 














[e 
Oo 
A MASM 和 GNU as 的 差异 








熟悉 Windows 或 MS-DOS 的 汇编 语言 的 人 可 能 会 不 习惯 GNU as 的 汇编 语言 。 一 般 
Windows 使 用 的 汇编 语言 是 MASM， 虽 然 都 是 描述 x86 CPU 的 机 器 语言 ,但 MASM 和 GNU as 
的 语法 不 尽 相 同 。 

MASM 和 GNU as 的 语法 差异 主要 有 以 下 5 处 。 


1. GNU as 的 指令 后 有 表示 操作 数 长 度 的 后 级 (b. w 1. q) 

2. GNU as 的 mov 指令 的 操作 数 顺 序 为 “ 源 操 作 数 、 目 的 操作 数 ” 
3. GNU as 的 寄存 器 名 字 前 需要 添加 S 符号 

4. GNU as 的 立即 数 前 需要 添加 $ 符号 

5. 间接 寻 址 的 语法 不 同 






























































例如 ， 要 在 eax 寄存 器 所 指向 的 内 存 中 存 入 整数 0 时 ，MASM 的 代码 如 下 所 示 。 
mov [eax], 0 
GNU as 的 话 代 码 则 如 下 所 示 。 


movl $0, (%eax) 














MASM 的 写法 称 为 Intel 汇编 ，GNU as 的 写法 称 为 AT&T 汇编 。 因 为 原本 UNIX 中 使 用 的 汇编 
器 就 是 基于 AT&T 汇编 格式 的 ， 所 以 GNU as 也 使 用 了 AT&T 汇编 。 

读者 一 开始 多 少 都 会 对 两 种 汇编 的 差异 感到 困惑 ， 但 毕竟 只 是 写法 方面 的 差异 ， 通 过 读 一 些 示 
例 代码 ， 或 者 尝试 自己 写 两 行 ， 就 会 逐渐 习惯 的 。 
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GNU 汇编 器 的 语法 








本 节 将 对 GNU 汇编 器 的 语法 进行 介绍 。 














汇编 版 的 Hello, World! 


下 面 让 我 们 具体 讲 一 下 GNU as 的 语法 。 以 Hello,World! 为 例 ， 汇 编 版 的 Hello,World! 程序 
如 代码 清单 13.2 所 示 。 
代码 清单 13.2  hello.c 的 编译 结果 ( hello.s ) 


.file "hello,c" 





.Section .rodata.strl.1,"aMS",Gprogbits,1 
.LCO0: 
.String "Hello, World!" 
.text 
.globl main 
type main, Gfunction 
main: 
leal 4(Sesp), $ecx 
andl $-16, $esp 
pushl -4 (%ecx) 
pushl %ebp 
movl Sesp, %ebp 
pushl %ecx 
subl $16, $esp 
pushl $.LCO 
call puts 
movil -4 (%ebp), %ecx 
xorl Seax, %eax 
leave 
leal -4 (%ecx), %esp 
ret 
.Size main, .-main 
.ident  "GCC: (GNU) 4.1.2 20061115 (prerelease) (Debian 4.1.1-21)" 
.Section .note.GNU-stack,"",Gprogbits 








GNU as 的 代码 由 指令 、 汇 编 伪 操作 、 标 签 和 注释 这 4 个 要 素 组 成 。 通 常 除 注释 外 ， 每 一 个 
要 素 单 独占 用 一 行 。 
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有 yy 指令 

让 我 们 从 指令 开始 说 起 。 

指令 (instruction) 是 直接 由 CPU 负责 处 理 的 命令 。 以 代码 清单 13.2 的 代码 为 例 ， 行 首 缩 
进 ， 并 且 不 以 点 “. ”开始 的 行 都 是 指令 行 。 下 面 举 几 个 指令 的 具体 例子 




















movi S$esp, $ebp 
pushl S$ecx 
subl $16, $esp 

















HU, movi 是 在 寄存 器 或 者 内 存 之 间 传 输 数 据 的 指令 ，pusphl 是 向 栈 压 数 据 的 指令 
subl 是 进行 减法 运算 的 指令 。 

指令 由 标识 命令 种 类 的 助 记 符 (mnemonic ) 和 作为 参数 的 操作 数 ( operand ) 组 成 。 以 指令 
movl %esp, £ebp 为 例 ，movl HDW, zesp 和 €ebp 这 2 个 是 操作 数 。 有 多 个 操作 数 时 
以 逗号 来 分 制 。 


F3 汇编 伪 操 作 
接着 来 说 一 下 汇编 伪 操 作 。 


以 点 “.” 开 头 ， 末尾 没有 冒号 “:” 的 行 都 是 汇编 伪 操 作 (directive) 行 。 例 如 .file 
"hello.c", .text, .globl main 都 是 汇编 伪 操 作 。 下 面 再 举 一 些 汇编 伪 操 作 的 例子 。 












































.String "Hello, World!" 
c TEGERE 

.globl main 
.type main, Gfunction 


iL DI TRTE AE DAR, MAE CPU 负责 处 理 的 指令 。 一 般 用 于 在 目标 文件 中 记录 元 数 
据 (meta data) 或 者 设 定 指令 的 属性 等 。 例 如 .string 是 用 来 定义 字符 串 常量 的 汇编 伪 操 
作 ，.text 是 提示 代码 段 的 汇编 伪 操 作 。 

因为 .string、.text 和 .glopbl 行 首 的 缩 进 不 同 ， 所 以 可 能 会 被 误 认 为 是 不 同类 型 的 
语法 关键 字 。 这 只 是 gce 输出 代码 的 习惯 而 已 ， 无 论 是 否 有 行 首 缩 进 ， 都 不 会 影响 汇编 伪 操 作 
的 运行 结果 。 


zi 标签 


着 说 一 下 标签 (label )。 
“:” 结 尾 的 行 都 是 标签 行 。 例 如 .Lco: 或 main:。 使 用 标签 的 例子 如 下 所 示 。 




























































































n OE 
Sas UT. i Vor NaN 
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标签 有 具有 为 汇编 伪 操 作 生 成 的 数据 或 者 指令 命名 ( 标 上 符号 ) 的 功能 ， 这 样 就 可 以 在 文件 
的 其 他 地 方 调用 通过 标签 定义 的 符号 。 例 如 上 述 代 码 就 是 为 .stzing 汇 编 伪 指令 定义 的 字符 
ts Ef .LC0。 

汇编 语言 中 可 用 于 名 字 ( 符号 ) 的 字符 范围 比 C 语言 广 ， 字母、 数字 、““、“$” 以 及 
“.” 都 可 以 使 用 。 因 此 如 果 只 是 在 汇编 带 内 部 使 用 的 符号 的 话 ， 可 以 加 上 “.”， 以 避免 和 C 语 
言 中 的 变量 重 名 。 在 某 些 情 况 下 ，C 语言 中 也 可 以 把 $ 作为 标识 符 使 用 。 这 种 情况 虽然 比较 少 
见 ， 但 仍 需 注意 。 例 如 ，gcc 中 指定 -fdollars-in-identifiers 选项 就 能 使 $ 成 为 有 效 的 
标识 符 ， 但 Cb 中 不 能 使 用 $ 作为 标识 符 。 

另外 ， 冒 号 只 是 语法 上 的 需要 ， 符 号 名 称 中 并 不 包含 冒号 。 例 如 main: 标签 的 符号 名 为 


main， 而 不 是 main:。 


Fm 
最 后 说 一 下 注释 ( comment )。 
GNU as 可 以 使 用 两 种 注释 ， 即 单行 注释 和 块 注 释 。 行 注释 从 # 开始 到 行 末 ， 块 注释 和 C 
语言 一 样 ， 从 /* 开始 ， 到 */ 结 
行 注 释 的 例子 如 下 所 示 。 
mov $1, $eax # 将 eax 寄存 器 置 为 1 
块 注释 的 例子 如 下 所 示 。 


mov $0, $eax  /* 所 有 内 存 
所 有 寄存 器 
将 所 有 指令 的 值 置 为 0 
然后 我 也 返回 0 */ 







































































FJ 助 记 符 后 组 


从 这 里 开始 我 们 将 详细 地 介绍 一 下 指令 的 相关 内 容 。 

先 来 说 一 下 指令 的 助 记 符 后 缀 (mnemonic suffix )。 刚 才 我 们 提 到 了 movl fll subl 为 助 记 
符 。 更 准确 地 说 ，mov 和 sub 为 助 记 符 , 末尾 的 1 是 后 级 。1 是 long 的 缩写 ， 表 示 作 为 操作 
对 象 的 数据 的 大 小 。1 是 表示 数据 的 大 小 为 32 位 的 后 绥 。 

类 似 这 样 的 后 缀 有 b、w、1， 分 别 表示 操作 8 位 、16 位 和 32 位 的 数据 。 表 13.1 中 对 后 级 
进行 了 总 结 。 
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I 操作 对 象 的 大 小 
b 8 位 

w 16 位 

| 32 位 














b 是 byte 的 缩写 ，w 是 word 的 缩写 。 


各 种 各 样 的 操作 数 

指令 的 参数 ( 操作 数 ) 有 如 下 4 种 。 
. 立即 数 
.寄存 器 
直接 内 存 引 
. 间接 内 存 引 

下 面 依次 来 解释 一 下 。 

首先 ， 立 即 数 (immediate value) 是 C 语言 中 的 字面 量 。 机 咒语 言 中 ， 立 即 数 以 整数 的 形 
式 出 现 ， 能 够 高 速 访问 。 像 $27 这 样 ， 立 即 数 用 $ 来 标识 。 如 果 忘 记 了 $， 就 会 变 成 后 面 要 讲 
的 “直接 内 存 引 用 ”， 这 一 点 请 注意 。 立 即 数 有 8 位 、16 位 和 32 位 。 

其 次 ， 寄 存 器 当然 也 能 作为 操作 数 。GNU 汇编 器 规定 寄存 器 必须 以 % 开头 ， 例 如 eax 寄存 
髓 写作 $eax。 

顺便 提 一 下 ，GNU 汇编 器 不 区 分 寄存 器 名 字 的 大 小 写 ， 因 此 也 可 以 将 $eax 写成 $EAX。 
但 大 小 写 混 杂 在 一 起 会 使 代码 难以 阅读 ， 因 此 要 统一 成 大 写 或 小 写 。cbec [HH gcc 的 做 法 统一 成 
小 写 。 

直接 内 存 引 用 (direct memory reference ) 是 直接 访问 固定 内 存 地 址 的 方式 。GNU TL bii 
将 任何 立即 数 都 解释 成 内 存 地 址 并 访问 。 例 如 ， 若 只 写 0 的 话 ， 就 会 访问 0 地 址 。 再 次 重申 0 并 
不 代表 立即 数 0， 而 是 意味 着 访问 内 存 的 0 号 地 址 。 

比 起 立即 数 ， 更 常用 的 是 使 用 符号 (symbol) 直接 访问 内 存 。 例 如 .Lco 的 意思 是 访问 符 
号 .LC0 所 指向 的 地 址 。 符 号 在 汇编 和 链接 的 过 程 中 会 被 置换 为 立即 数 〈 内存 地 址 )， 因 此 对 于 
CPU 来 说 ,使 用 符号 和 直接 编写 立即 数 没 有 差别 。 将 符号 置换 为 立即 数 的 过 程 将 在 第 19 章 之 
后 说 明 。 

有 直接 访问 就 有 间接 访问 。 间 接 内 存 引 用 (indirect memory reference ) 是 将 寄存 器 的 值 解释 
为 内 存 地 址 并 访问 的 方式 。 间 接 内 存 引 用 还 分 不 同 的 类 型 ， 下 面 详细 介绍 一 下 。 


















































































































































244 | 第 13 章 x86 汇编 器 编程 


FJ 间接 内 存 引 用 
间接 内 存 引 用 中 最 复杂 、 最 通用 的 就 是 下 面 这 样 的 形式 。disp、base、index、scale 
中 的 任何 一 者 都 可 以 省 略 。 


























disp(base, index, scale) 


上 述 指令 访问 (base + index * scale) + disp 的 地 址 。 但 是 写成 这 样 可 能 还 是 无 法 让 
人 理解 其 含义 ， 因 此 让 我 们 从 更 为 简单 且 常 用 的 形式 开始 讲解 。 
首先 ， 最 简单 的 间接 内 存 引用 的 形式 如 下 所 示 。 





(Seax) 


即 只 指定 基地 址 (base) 的 形式 。 上 述 表达 式 将 eax 寄存 器 中 的 数据 作为 内 存 地 址 来 访问 
WE. WRH. 〈C 话 言 的 ) 变量 var 的 地 址 赋 给 seax， 那 么 (seax) 就 是 变量 var 的 值 。 
HUE, d disp 的 形式 如 下 所 示 。disp 是 displacement ( 偏 移 ) 的 简称 。 











4 (Seax) 


上 述 形 式 的 间接 内 存 引 用 是 在 $eax 寄存 需 的 数据 的 基础 上 加 上 disp 的 4， 以 此 作为 内 存 
地 址 进行 访问 。 在 C 语言 中 ， 这 就 相当 于 访问 如 下 所 示 的 结构 体 point 中 的 成 员 y 时 的 情况 。 











struct point [ 
int xX; 
iney 


请 看 图 13.1。 将 结构 体 的 起 始 地 址 ( 等 同 于 成 员 x 的 地 址 ) ， : 
WA eax 寄存 器 后 ， 成 员 y 的 地 址 就 是 “eax 的 值 + 4”。 访问 y 的 Msn 
汇编 表达 式 即 为 4 (%eax) 。 

最 后 ， 使 用 index 和 scale 的 情况 如 下 所 示 。 





(Sebx, $eax, 4) 


上 述 形式 的 间接 内 存 引用 所 访问 的 是 sepx 寄存 需 的 值 加 上 
"*eax 寄存 带 的 值 x4” 后 得 到 的 地 址 。 这 种 形式 相当 于 C 语言 
中 的 数组 访问 。 要 访问 元 素 大 小 为 4 字 节 (例如 inc) 的 数组 中 
第 seax 个 元 素 时 ， 就 可 以 使 用 上 述 式 子 。 
将 上 述 所 有 形式 合 到 一 起 ， 就 是 一 开始 呈现 的 间接 内 存 引 用 的 | : 
完整 形式 ， 让 我 们 再 来 看 一 下 。 图 13.1 结构 体 成 员 的 地 址 


4(%eax) 


8(%eax) 


disp(base, index, scale) 
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即 访问 地 址 为 aisp + (base + index * scale) 的 内 存 。base 和 index 为 寄存 器 ， 
disp 为 立即 数 (包括 符号 )，scale 必须 是 1、2、4、8 之 中 的 任意 立即 数 。 

刚才 提 到 了 (base, index, scale) 的 形式 相当 于 C 语言 中 的 数组 访问 ,但 并 非 所 有 的 
数组 访问 都 可 以 仅 靠 间 接 内 存 引用 来 表示 。 例 如 ， 因 为 scale 只 能 是 1、2、4、8 之 一 ， 所 以 
当 数组 的 元 素 是 庞大 的 结构 体 时 ， 就 不 能 仅 靠 间接 内 存 引 用 来 访问 数组 元 素 。 这 时 就 必须 组 合 
使 用 其 他 的 指令 ， 明 确 计算 地 址 之 后 再 访问 内 存 。 


x86 指令 集 的 概要 


在 本 节 的 最 后 ， 让 我 们 来 讲 一 下 x86 架构 的 指令 集 的 概要 。 

x86 的 指令 集 可 分 为 以 下 4 种 。 

1. 通用 指令 

2.x87 FPU 指令 

3. SIMD 指令 

4. 系统 指令 

本 书 只 涉及 了 通用 指令 。x87 FPU 指令 是 浮 点 数 运 算 的 指令 ，SIMD 指令 是 SSE 指令 ,最 
后 的 系统 指令 是 写 OS 内 核 时 使 用 的 特殊 指令 。 
具体 来 说 ,通用 指令 能 够 进一步 分 为 以 下 种 类 。 
1. 数据 传输 指令 


算 指令 



















































































2. 二 进 制 运 








3. 十 进 制 运 
4. 逻辑 指令 

5. shift 指令 和 rotate 指令 
6. bit 指令 和 byte 指令 
7. 控制 跳 转 指令 

8. 存储 指令 

9. 标志 控制 指令 

10. 段 寄 存 器 指令 
11. 其 他 


本 书 将 从 中 严格 选取 Cb 编译 需 所 必需 的 指令 进行 讨论 。x86 架构 中 残存 着 大 量 过 时 且 无 用 
的 指令 ， 因 此 没有 必要 记 住所 有 的 指令 ， 掌 握 经 常 使 用 的 重要 指令 就 可 以 了 。 











算 指 令 
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传输 指令 








从 本 节 开 始 我 们 将 讲解 x86 指令 的 相关 内 容 。 先 来 看 访问 寄存 器 或 内 存 并 传输 数据 的 指令 。 
具体 来 说 ， 我 们 要 讲解 的 指令 如 表 13.2 所 示 。 
表 13.2 传输 指令 



























































指令 作用 
mov 单纯 的 一 对 一 的 传输 
push、pop 压 栈 和 出 栈 
lea 加 载 地 址 
movsx、movzx 伴随 有 符号 扩展 / 零 扩展 的 数据 传输 
上 表 中 的 指令 按照 使 用 频率 由 高 到 低 的 顺序 排列 。 无 法 想象 有 不 使 用 mov 的 程序 ， 但 不 使 











用 movsx 或 movzx 的 程序 却 是 非常 可 能 存在 的 。 所 以 对 于 稍 显 上 隐 梁 的 movsx fll movzx, 不 
理解 的 话 直 接 忽略 也 没有 关系 。 


mov 指令 

JEM mov 指令 说 起 。mov 是 在 寄存 器 或 内 存 之 间 传 输 数据 ， 或 者 将 立即 数 加 载 到 寄存 器 或 
内 存 的 指令 。mov 也 是 汇编 语言 中 最 常用 的 指令 之 一。 

这 里 说 的 “传输 ”近似 于 C 语言 中 的 赋值 ， 仅 仅 是 复制 数据 ， 并 非 移 动 数据 。 也 就 是 说 ， 
mov 指令 并 不 会 删除 或 破坏 源 数据 。 

mov 指令 有 如 下 这 些 形 式 。 




















mov 立即 数 ， 寡 存 器 
mov 寄存 器 ， 寄 存 器 
mov 内 存 ， 寄 存 器 
mov 立即 数 ， 内 存 
mov 寄存 器 ， 内 存 
mov 内 存 ， 内 存 








如 上 所 述 ,“ 立 即 数 和 寄存 器 "”“ 寄 存 吉 和 寄存 器 ”等 可 以 作为 mov 指令 的 操作 数 使 用 。 
x86 的 指令 可 以 组 合 使 用 各 类 操作 数 ， 因 此 本 书 将 操作 数 的 组 合 总 结 了 出 来 ， 如 上 所 示 。 
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mov 的 第 1 操作 数 表示 传输 “ 源 ”， 第 2 操作 数 表示 传输 “目标 ”。 例 如 “mov RAE, A 
器 ”表示 将 内 存 中 的 值 加 载 到 寄存 器 。 

实际 在 编写 指令 时 ， 还 需要 根据 所 传输 的 数据 的 大 小 添加 助 记 符 后 级。 例如 将 32 位 宽 的 立 
即 数 105000 加 载 到 eax 寄存 器 时 ， 要 加 上 后 缀 1， 写 成 下 面 这 样 。 





movi $105000, %eax 


将 寄存 器 ecx 中 的 值 转移 到 eax AITARI S 1S WII FIR o 
movil $ecx, $eax 
最 后 ， 将 ecx 寄存 器 中 的 数据 作为 地 址 访问 内 存 ， 并 将 内 存 上 的 数据 加 载 到 eax 寄存 器 中 
的 写法 如 下 所 示 。 
movil (Secx), %eax 
不 习惯 汇编 的 话 会 觉得 secx 和 (secx) 的 区 别 难以 理解 ， 可 以 把 它 当 作 C 语言 的 指针 。 
指针 变量 ptr 自身 的 值 等 同 于 secx 的 话 ， 那 么 对 指针 的 取 值 操作 *ptr 就 相当 于 ($ecx)。 
另外 ，secx 是 访问 寄存 器 ， 而 ($ecx) 则 是 利用 寄存 器 访问 内 存 。 


push 指令 和 pop 指令 












































Push 立即 数 
Push 寄存 器 


push 指令 将 数据 压 栈 。 具 体 来 说 ， 将 esp 寄存 器 减 去 压 栈 的 数据 的 大 小 ， 再 将 数据 存储 到 
esp 寄存 器 所 指向 的 地 址 。 





pop 寄存 器 


pop 指令 将 数据 出 栈 并 写 和 寄存器。 具体 来 说 ， 将 数据 从 esp 寄存 器 所 指向 的 地 址 加 载 到 
寄存 器 ， 再 将 esp 寄存 器 加 上 出 栈 的 数据 的 大 小 。 

push 指令 和 pop 指令 都 是 操作 栈 的 指令 ， 示 意图 如 图 13.2 Bras 

如 下 所 示 为 使 用 push 指令 和 pop 指令 的 例子 。 这 个 例子 由 4 条 语句 组 成 ， 利 用 栈 将 eax 
寄存 器 和 ecx 寄存 器 中 的 数据 进行 交换 。 





























pushl  $eax # 将 eax 寄存 器 中 的 数据 压 栈 
pushl $ecx # 将 ecx 寄 存 器 中 的 数据 压 栈 
popl $eax # 将 栈 项 的 数据 加 载 到 eax 寄存 器 
popl $ecx # 将 栈 项 的 数据 加 载 到 ecx 寄存 器 
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实际 交换 寄存 需 中 的 数据 时 不 会 使 朋 
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| | pem 
esp 
push 96eax 
I 
e 





， | 地 址 OXFFFFFFFF 


[ | [e 
esp 
pop 96ecx 
77 


! | 地址 OxFFFFFFFF 


13.2 push 指令 和 pop 指令 








据 的 专用 指令 。 使 用 xchg 要 更 为 简单 、 快 速 。 


lea 指令 





目 上 述 方法 ， 因 为 有 xchg 这 样 的 在 寄存 带 之 间 交 换 数 





lea 内 存 ， 寄 存 器 











lea 指令 将 地 址 加 载 到 寄存 器 。lea 是 Load Effective Address ( 实效 地 址 加 载 ) 的 简称 。 
"lea 内 存 ， 寄 存 器 ”将 内 存 对 应 的 地 址 加 载 到 寄存 吉 。 




















通过 和 mov 指令 进行 对 比 ， 会 更 容易 理解 1ea 指令 的 功能 。 例 如 下 面 的 mov 指令 


示 将 
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ebx 寄存 顺 加 4 后 的 值 作为 内 存 地 址 进行 访问 ， 并 将 数据 加 载 到 eax 寄存 融 中 。 





movil 4 (%ebx), $eax 


男 一 方面 ， 将 上 述 语句 中 的 mov 指令 替换 为 lea 指令 ， 如 下 所 示 。 该 语句 表示 将 ebx 寄存 
需 加 上 4 后 的 值 保存 到 eax。 





leal 4 (%ebx), $eax 


同样 是 间接 内 存 引 用 的 语句 ，mov 指令 取得 的 是 内 存 地 址 所 指向 的 内 存 上 的 数据 ， 而 lea 
指令 取得 的 是 内 存 地 址 本 里。 

也 就 是 说 ，lea 指令 乍 看 之 下 像 数 据 传输 指令 ， 实 则 是 计算 地 址 的 运算 指令 。 实 际 上 在 
Intel 的 手册 中 1ea 指令 被 归 类 成 “其 他 指令 ”"， 而 并 非 传输 指令 。 只 是 笔者 觉得 将 1ea 指令 和 
传输 指令 一 起 说 明 会 比较 容易 理解 ， 所 以 放 在 本 节 中 介绍 。 











movsx 指令 和 movzx 指令 








movsx 内 存 ， 寄 存 器 
movsx 寄存 器 ， 寄 存 器 
movzx 内 存 ， 寄 存 器 
movzx 寄存 器 ， 寄 存 器 








movsx 和 movzx 是 将 数据 从 位 宽 较 小 的 变量 扩展 为 位 宽 较 大 的 变量 的 指令 。 例 如 在 编译 C 
语言 (Cb) 的 类 型 转换 时 就 会 用 到 上 述 指令 。 

movsx 指令 将 8 位 或 16 位 的 数据 进行 符号 扩展 并 加 载 到 寄存 器 。movzx 指令 将 8 位 或 16 
位 的 数据 进行 零 扩 展 并 加 载 到 寄存 器 。 符 号 扩展 和 零 扩 展 的 相关 内 容 将 稍 后 说 明 ， 和 暂且 只 需 记 
住 是 对 位 的 宽度 进行 扩展 的 操作 即 可 。 

实际 使 用 movsx 指令 和 movzx 指令 时 ， 必 须 同时 指定 传输 源 和 传输 目标 的 大 小 ， 所 以 助 
记 符 后 级 使 用 2 个 字符 。 请 使 用 2 个 字符 的 后 绥 来 蔡 换 movsx 和 movzx 中 的 xo 

如 下 所 示 为 使 用 movsx 指令 和 movzx 指令 的 一 些 例子 。 





— 



































movsbl $al, $eax # 将 al 寄存 器 中 的 8 位 有 符号 数 扩展 到 32 位 并 加 载 到 eax 寄存 器 
movswl %ax, %eax # 将 ax 寄存 器 中 的 16 位 有 符号 数 扩展 到 32 位 并 加 载 到 eax 寄存 器 














movzbl $al, $eax 
movzwl  $ax, $eax 


在 CPU 的 参考 手册 中 查找 movsx 和 movzx， 会 发 现存 在 和 movsx 指令 名 字 类 似 的 指令 
movs, movs 属于 存储 指令 ， 和 movsx 完全 不 同 。 




















将 al 寄存 器 中 的 8 位 无 符号 数 扩展 到 32 位 并 加 载 到 eax 寄存 器 
将 al 寄存 器 中 的 16 位 无 符号 数 扩展 到 32 位 并 加 载 到 eax 寄存 器 
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符号 扩展 和 零 扩 展 


下 面 说 一 下 符号 扩展 和 和 零 扩 展 。 

现在 假设 我 们 要 将 8 位 的 整数 13 ( 二进制 表示 为 00001101 ) 扩展 到 16 位。 例如， 在 将 
unsigned char 类 型 的 数值 13 转换 为 unsigned short 类 型 的 数值 13 时 ， 就 会 发 生 这 样 的 
转换 。 

在 上 述 情况 下 ， 合 理 的 转换 结果 是 在 高 位 补 8 个 0， 即 0000000000001101。 这 种 高 位 补 0 
的 操作 称 为 零 扩展 (zero extension )。 零 扩展 的 示意 图 如 图 13.3 所 示 。 在 C 语言 的 类 型 转换 中 ， 
无 符号 的 数据 类 型 的 扩展 使 用 的 就 是 零 扩 展 。 


00001101 8 位 的 整数 13 
































0000000000001101 16 位 的 整数 13 
13.3 ”数据 的 零 扩 展 


无 符号 数据 类 型 的 扩展 使 用 零 扩 展 ， 那 么 是 不 是 有 符号 数据 类 型 的 扩展 就 应 该 使 用 符号 扩 
展 呢 ? 没 错 ， 符 号 扩展 (sign extension ) 是 有 符号 数据 类 型 的 扩展 时 使 用 的 操作 ， 根 据 下 列 规 
则 对 位 的 宽度 进行 扩展 。 

1. 原 数据 的 最 高 位 为 0 时 在 高 位 补 0 ( 和 零 扩 展 相同 ) 

2. 原 数据 的 最 高 位 为 1 时 在 高 位 补 1 

有 符号 数 的 最 高 位 为 符号 位 。 符 号 位 为 0 则 该 数据 为 正 数 或 0， 因 此 符号 扩展 的 规则 也 可 
以 表述 为 “ 正 数 或 0 的 话 高 位 补 0， 负 数 的 话 高 位 补 1”。 扩 展 正 数 或 0 的 时 候 在 高 位 补 0 的 原 
因 和 和 零 扩 展 相 同 ， 这 里 就 不 细 说 了 。 

另 一 方面 ， 负 数 时 补 1 的 原因 在 于 负数 是 用 二 进 制 补 码 表现 的 。 例 如 8 位 的 整数 -2 的 二 进 
制 表 现形 式 为 11111110，16 位 的 整数 -2 的 二 进 制 表现 为 1111111111111110。 由 此 可 见 ， 将 8 
位 的 整数 -2 转换 为 16 位 的 整数 时 ， 只 需 在 高 位 补 8 个 1 即 可 。 这 个 性 质 也 适用 于 其 他 所 有 的 
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本 节 我 们 来 讲 一 下 汇编 语言 中 的 算术 运算 ( 加 减 乘除 ) 指令 。 本 节 中 涉及 的 指令 如 表 13.3 










































































所 示 。 
表 13.3 本 节 中 涉及 的 算术 运算 指令 

指令 功能 

add 加 法 

sub 减法 

imul ( 有 符号 的 ) 乘法 
idiv ( 有 符号 的 ) 除法 
div 无 符号 的 除法 
inc É 

dec 9È 

neg 取 反 











add 指令 











f ~" 
add 立即 数 ， 寄 存 器 
add 寄存 器 ， 寄 存 器 
add 内 存 ， 寄 存 器 
add 立即 数 ， 内 存 
L add 寡 存 器 ， 内 存 J 








add 指令 将 第 1 操作 数 和 第 2 操作 数 相 加 ， 并 将 结果 写 和 人 第 2 操作 数 。 
请 注意 “将 运算 结果 写 人 第 2 操作 数 ”这 一 点 。 例 如 adasi, seax 表示 将 eax 寄存 器 的 数 
据 加 1， 并 将 结果 保存 到 eax 寄存 器 。 类 似 于 C 语言 中 的 += 运算 。 
下 面 再 举 几 个 使 用 aaa 指令 的 例子 。 


addl 
addl 
addl 




















$1, %šeax # 将 eax 寄存 器 加 1 
$ecx, %eax # eax 寄存 器 和 ecx 寄存 器 的 数据 相 加 后 存放 到 eax 寄存 器 
$4, (%ebx) # 将 ebx 寄存 器 所 指向 的 内 存 中 的 数据 加 4 
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进位 标志 


由 于 寄存 器 和 存储 器 都 有 位 宽 的 限制 ， 因 此 在 进行 加 法 运算 时 就 有 可 能 发 生 溢出 。 例 如 8 
位 的 整数 156 和 8 位 的 整数 100 相 加 ， 运 算 结果 的 宽度 就 超过 8 位 ， 发 生 游 出。 

运算 结果 发 生 溢出 的 话 ，CPU 的 标志 寄存 器 eflags 中 的 进位 标志 (Carry Flag, CF) 就 会 被 
置 位 ， 即 被 设置 为 1。 

利用 aac 指令 再 加 上 进位 标志 ， 就 能 在 32 位 的 机 器 上 进行 64 位 数据 的 加 法 运算 。C 语言 
中 的 Long long 类 型 的 数据 运算 等 就 是 利用 这 个 功能 。 本 书 不 涉及 64 位 数据 的 运算 ， 可 以 在 
自制 的 编译 器 中 试 着 用 一 下 。 


F3 sub ig 
































sub XMS, SER | 
sub 寄存器， 寄存 器 

sub ”内 存 ， 寄 存 器 

sub 立即 数 ， 内 存 

sub — 寄存器， 内存 | 








sub 指令 用 第 2 操作 数 减 去 第 1 操作 数 ， 并 将 结果 写 人 第 2 操作 数 。 即 sub x, y 相当 于 
C 语言 中 的 y -= x. 
下 面 举 几 个 使 用 sub 指令 的 例子 。 





subl $4, $esp 4 esp 寄存 器 的 值 减 4 
subl $ecx, %eax # eax 寄存 器 的 值 减 去 ecx 寄存 器 的 值 
subl $eax, (£ebx) # ebx 寄存 器 所 指向 的 内 存 中 的 数据 减 去 eax 寄存 器 的 值 





add 指令 有 对 应 的 64 位 运算 的 指令 adc， 同 样 sub 指令 也 有 对 应 的 64 位 运算 的 指令 
sbb。sbb 指令 和 adc 指令 一 样 ， 都 是 利用 进位 标志 进行 64 位 运算 。 详 细 内 容 请 参考 CPU 的 
参考 手册 。 


imul 指令 








imul 寄存 器 ， 寄 存 器 
imul 内 存 ， 寄 存 器 


imul 立即 数 ， 寄 存 器 
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imul 指令 将 第 1 操作 数 和 第 2 操作 数 相 乘 ， 并 将 结果 写 和 人 第 2 操作 数 。imul 指令 还 有 1 
操作 数 和 3 操作 数 的 形式 ， 本 书 所 涉及 的 仅 限 于 2 操作 数 的 形式 。 

另外 ，2 操作 数 形式 的 imul 指令 不 支持 宽度 为 8 位 的 寄存 顺和 存储 需 作 为 操作 数 。 只 有 当 
2 个 操作 数 都 为 16 位 或 32 位 时 才能 进行 运算 。 

下 面 举 几 个 使 用 imul 指令 的 例子 。 











imul $ecx, $eax 4 eax 寄存 器 和 ecx 寄存 器 的 值 相 乘 ， 结 果 写 入 eax 寄存 器 
imul (Sebx), $eax 4 eax 寄存 器 和 ebx 寄存 器 所 指向 的 内 存 上 的 数据 相 乘 ， 结 果 写 入 eax 寄存 器 


CPU 的 参考 手册 以 及 讲解 汇编 语言 的 书籍 中 都 将 imul 指令 描述 为 “有 符号 的 乘法 运算 ”。 

另外 ，CPU 还 特地 提供 了 无 符号 乘法 专用 的 指令 mul， 因 此 总 感觉 无 符号 的 乘法 必须 使 用 mul 
B o 

实际 上 在 操作 数 和 结果 的 位 宽 相 同 的 情况 下 ， 无 论 是 否 有 符号 ， 都 可 以 利用 imul 指令 来 
计算 。 也 就 是 说 ， 在 实现 Cb 的 编译 器 时 ，mul 指令 并 不 是 必需 的 。gcc 对 于 一 般 的 乘法 也 不 会 
ER mul 指令。 只 有 在 32 位 的 环境 下 进行 64 位 数据 的 运算 等 的 时 候 ， 才 会 使 用 mul 指令 。 

使 用 mul 指令 时 有 一 些 严 格 的 限制 ， 比 如 运算 时 必须 使 用 固定 的 寄存 器 等 。 因 此 在 进行 
法 运算 时 ， 比 起 mul 指令 ， 还 是 推荐 使 用 imul 指令 。 


idiv 指令 和 div 指令 


idiv 寄存 器 

div 寄存 器 

idiv 是 有 符号 数 的 除法 运算 指令 ，div 是 无 符号 数 的 除法 运算 指令 。 被 除数 由 edx 寄存 带 
和 eax 寄存 器 拼接 而 成 ， 除 数 由 第 1 操作 数 指定 ， 计 算 结果 的 商 和 余数 分 别 写 人 eax 寄存 器 和 
edx 寄存 带 。 运 算 时 被 除数 、 商 和 余数 的 数据 的 位 宽 是 不 一 样 的 ， 详 细 内 容 请 参考 表 13.4。 
x 13.4 idiv 指令 和 div 指令 使 用 的 寄存 器 
















































































数据 的 位 宽 被 除数 除数 商 余数 
8 位 ax 第 1 操作 数 al ah 
16 位 并 接 dx 和 ax 第 1 操作 数 ax dx 
32 位 并 接 edx 和 eax 第 1 操作 数 eax edx 

















idiv 指令 和 div 指令 通常 是 对 位 宽 2 倍 于 除数 的 被 除数 进行 除法 运算 的 。 也 就 是 说 ， 除 
数 是 16 位 的 话 ， 被 除数 就 必须 为 32 位 ; 除数 是 32 位 的 话 ， 被 除数 就 必须 为 64 位 。x86 的 通用 
寄存 需 为 32 位 ，1 个 寄存 需 无 法 容纳 64 位 的 数据 ， 因 此 在 edx 寄存 器 和 eax 寄存 需 中 各 存放 一 半 
的 位 数 。 当 除数 为 32 位 时 ，edx 寄存 器 存放 被 除数 的 高 32 位 ，eax 寄存 器 存放 被 除数 的 低 32 位 。 
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由 于 Cb 中 没有 64 位 的 数据 类 型 ， 因 此 被 除数 始终 小 于 或 等 于 32 位 。 这 样 的 情况 下 ， 在 进 
行 除法 运算 之 前 ， 必 须 将 设置 在 eax 寄存 器 中 的 32 位 数据 扩展 到 包含 edx 寄存 器 在 内 的 64 位 。 
即 有 符号 数 进行 符号 扩展 ， 无 符号 数 进行 零 扩 展 。 

对 edx 寄存 器 进行 零 扩 展 只 需 将 edx 设置 为 0 即 可 。 对 edx 进行 符号 扩展 时 可 以 使 用 clta 
指令 。cltad 指令 的 形式 如 下 所 示 。 


cltd Æ AT&T 的 命名 形式 ，Intel 的 手册 中 使 用 的 名 称 为 caq。GNU 汇编 器 同时 支持 
cltd 和 cdq， 无论 使 用 哪个 指令 都 可 以 。 本 书 中 和 gcc 一 致使 用 clita, BEAK] CPU 的 参考 
手册 时 请 使 用 “cdq”。 

使 用 idiv 指令 对 有 符号 数 进行 除法 运算 的 例子 如 下 所 示 。 至 今 为 止 我 们 看 到 的 例子 都 是 
每 1 行 作为 1 个 独立 的 例子 ， 而 idiv 的 例子 则 是 用 代码 清单 整体 来 表示 单个 例子 。 












































movl -12(S$ebp), $ecx # 将 地 址 为 ebp-12 的 数据 加 载 到 ecx 寄存 器 
movl -8 (%ebp), %eax # 将 地 址 为 spp-8 的 数据 加 载 到 eax 寄存 器 
H 
H 

















cltd 将 eax 寄存 器 中 的 数据 符号 扩展 到 edx:eax 
idivl $ecx 执行 有 符号 的 除法 运算 eax/ecx 








使 用 div 指令 的 无 符号 数 的 除法 运算 的 例子 如 下 所 示 。 


movil -12 ($ebp), £ecx # 将 地 址 为 epp-12 的 数据 加 载 到 ecx 寄存 器 
movil -8(Sebp), $eax # 将 地 址 为 ebp-8 的 数据 加 载 到 eax 寄存 器 
# 
# 




















movl $0, £edx 将 edax 寄存 器 置 为 0 RIR) 
divl $ecx 执行 无 符号 的 除法 运算 eax/ecx 





inc 指令 











inc 指令 将 第 1 操作 数 加 1， 相 当 于 C 语言 中 的 ++。 
使 用 inc 指令 的 例子 如 下 所 示 。 


incl $eax # eax 寄存 器 中 的 数据 加 1. 
incl (&ebx) # ebx 寄存 器 所 指向 的 内 存 中 的 数据 加 1 
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F3 dec S 


dec 寄存 器 
dec 内 存 











dec 指令 将 第 1 操作 数 减 1， 相 当 于 C 语言 中 的 --。 
使 用 dec 指令 的 例子 如 下 所 示 。 


decl eax # eax 寄存 器 中 的 数据 减 1 
decl (&ebx) # ebx 寄存 器 所 指向 的 内 存 中 的 数据 减 1 


neg 指令 


neg 寄存 器 











neg 内 存 














neg 指令 将 第 1 操作 数 的 符号 进行 反 转 ， 相 当 于 C 语言 中 的 一 元 运算 符 -。 
使 用 neg 指令 的 例子 如 下 所 示 。 








negl $eax 4 将 eax 寄存 器 中 的 数据 的 符号 反 转 
negl (Sebx) # 将 ebx 寄存 器 所 指向 的 内 存 中 的 数据 的 符号 反 转 
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本 节 将 介绍 各 类 位 运算 的 指令 。 本 节 中 所 涉及 的 位 运算 指令 如 表 13.5 所 示 。 


表 13.5 本 节 中 所 涉及 的 位 运算 指令 


























指令 功能 

and 按 位 与 ( bitwise AND ) 

or 按 位 或 ( bitwise OR ) 

xor 按 位 异 或 ( bitwise exclusive OR ) 
not 按 位 取 反 ( bitwise NOT ) 

sal 算术 左 移 

Sar 算术 右 移 

shr ( 逻辑 ) 右 移 








and 指令 








and 
and 
and 
and 


and 


立即 数 ， 寄 存 器 
寄存 器 ， 寄 存 器 
内 存 ， 寄 存 器 
立即 数 ， 内 存 
寄存 器 ， 内 存 





"A 








and 指令 将 第 2 操作 数 和 第 1 操作 数 进行 按 位 与 (bitwise AND) 运算 ， 并 将 结果 写 人 第 2 
操作 数 ， 相 当 于 C 语言 中 的 e= 运算 符 。 





andl 





使 用 ana 指令 的 例子 如 下 所 示 。 


, Seax # 将 eax 寄存 器 和 8 的 逻辑 与 的 结果 写 入 eax 寄存 器 
# (eax 寄存 器 只 剩 下 从 低地 址 算 起 的 第 3 位 ) 


( 
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or 指令 


or 立即 数 ， 寄 存 器 
or 寡 存 器 ， 寄 存 器 
or 内 存 ， 寄 存 器 
or 立即 数 ， 内 存 
or 寄存 器 ， 内 存 











D 





E 


D. 


or 指令 将 第 2 操作 数 和 第 1 操作 数 进行 按 位 或 ( bitwise OR) 运算 ， 并 将 结果 写 和 人 第 2 5 
作 数 ， 相 当 于 C 语言 中 的 | = 运算 符 。 
使 用 or 指令 的 例子 如 下 所 示 。 


orl $1, $eax # 将 eax 寄存 器 的 最 低位 置 1 
TER ep 
xor 指令 
7 


xor 立即 数 ， 寄 存 器 
xor 寄存 器 ， 寄 存 器 
xor 内 存 ， 寄 存 器 
xor 立即 数 ， 内 存 
xor 立即 数 ， 内 存 


























xor 指令 将 第 2 操作 数 和 第 1 操作 数 进行 按 位 异 或 (bitwise exclusive OR ) 运算 ， 并 将 结 
写 和 第 2 操作 数 ， 相 当 于 C 语言 中 的 “= 运算 符 。 
使 用 xor 指令 的 例子 如 下 所 示 。 











xorl $2, $eax # 将 eax 寄存 器 中 从 低地 址 算 起 的 第 2 位 取 反 
xorl $eax, $eax H 将 eax 寄存 器 置 0 (x86 汇编 的 惯用 语句 ) 























not 指令 
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not 指令 将 第 1 操作 数 按 位 取 反 (bitwise NOT )， 并 将 结果 写 人 第 1 操作 数 ， 相 当 于 C 语 


言 中 的 “- 





notl 
notl 





3k ws 


运算 符 。 


使 用 not 指令 的 例子 如 下 所 示 。 


年 eax 寄存 器 按 位 取 反 
Kf ebx 寄存 器 所 指向 的 内 存 上 的 数据 按 位 取 反 


$eax 
($ebx) 





+ # 
34 


sal 指令 








sal 
sal 
sal 


sal 


立即 数 ， 寄 存 器 
%c1， 寄 存 器 
立即 数 ， 内 存 
%cl， 内 存 





sal 指令 将 外 


B 2 操作 数 按照 第 1 操作 数 指定 的 位 数 进行 左 移 操作 ， 并 将 结果 写 和 第 2 操作 








数 。 移 位 之 后 空 出 的 低位 补 0。 相 当 于 C 语言 中 的 <<= 运算 符 。 
sal 指令 的 第 1 操作 数 只 能 是 8 位 的 立即 数 或 cl 寄存 器 ， 并 且 都 是 只 有 低 5 位 的 数据 才 有 














意义 ， 高 于 或 等 于 6 位 的 第 1 操作 数 意味 着 超过 31 位 的 移 位 ， 寄 存 器 中 的 所 有 数据 都 被 移 走 而 
变 得 没有 意义 。 
使 用 sal 指令 的 例子 如 下 所 示 。 


sall 
galt 


sal 是 








$1, $eax # 将 eax 寄 存 器 中 的 数据 左 移 1 位 
$cl, (%ebx) # 将 ebx 寄存 器 所 指向 的 内 存 中 的 数据 按照 cl 寄存 器 指定 的 位 数 i 





Shift Arithmetic Left 的 简称 。 


sar 指令 








行 左 移 








sar 


sar 


sar 


sar 


立即 数 ， 寄 存 器 
%c1， 寄 存 器 
立即 数 ， 内 存 
%cl， 内 存 





sar 指令 将 多 


B 2 操作 数 按照 第 1 操作 数 指定 的 位 数 进行 右 移 操作 ， 并 将 结果 写 入 第 2 操作 











数 。 移 位 之 后 空 出 的 高 位 进行 符号 扩展 。 相 当 于 C 语言 中 的 >>= 运算 符 。 
和 sal 指令 一 样 ，sar 指令 的 第 1 操作 数 也 必须 为 8 位 的 立即 数 或 cl 寄存 锅 ， 并 且 也 是 只 
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有 低 5 位 的 数据 才 有 意义 。 
使 用 sar 指令 的 例子 如 下 所 示 。 


sarl $1, $eax 4 将 eax 寄 存 器 中 的 数据 右 移 1 位 
sarl $cl, (Sebx) # 将 epx 寄存 器 所 指向 的 内 存 中 的 数据 按照 cl 寄存 器 指定 的 位 数 进 行 右 移 


























sar 是 Shift Arithmetic Right 的 简称 。 
F3 shr 指 令 


shr 立即 数 ， 寄 存 器 
shr %cl， 寄 存 器 
shr 立即 数 ， 内 存 
shr %cl， 内 存 











shr 指令 将 第 2 操作 数 按照 第 1 操作 数 指定 的 位 数 进行 右 移 操作 ， 并 将 结果 写 人 第 2 操作 
数 。 移 位 之 后 空 出 的 高 位 进行 零 扩 展 。 相 当 于 C 语言 中 对 无 符号 数 进行 操作 的 >>= 运算 符 。 

和 sal 指令 以 及 sar 指令 一 样 ，shr 指令 的 第 1 操作 数 必须 为 8 位 的 立即 数 或 cl 寄存 器 。 
并 且 同 样 只 有 低 5 位 的 数据 才 有 意义 。 

使 用 shr 指令 的 例子 如 下 所 示 。 
































shrl $1, $eax # 将 eax 寄存 器 中 的 数据 右 移 1 位 
shrl $cl, (%ebx) 4 将 ebx 寄存 器 所 指向 的 内 存 中 的 数据 按照 cl 寄存 器 指定 的 位 数 进 行 右 移 








shr 是 Shift Right 的 简称 。 
就 像 sar 指令 有 对 应 的 shr 指令 一 样 ，sal 指令 也 有 对 应 的 shl 指令 。 只 
shl 指令 的 动作 完全 相同 ， 没 有 必要 区 分 使 用 。 


pu 
Uu 

w 

HH 
Tk 
a> 
> 
pi 
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流程 的 控制 











本 节 我 们 将 讲解 实现 if 或 while 这 样 的 流程 控制 语句 时 所 使 用 的 指令 。 本 节 中 介绍 的 指 
令 如 表 13.6 所 示 。 
表 13.6 本 节 中 涉及 的 控制 跳 转 指令 






























































指令 功能 

jmp 无 条 件 跳 转 

jz, jnz, je. jne 条 件 跳 转 

cmp 数据 的 比较 

test 数据 的 非 0 检查 
sete、setne、setg、setge、setl、setle 获取 eflags 寄存 器 中 的 各 个 标志 位 
call 函数 调 

ret 从 子 程序 返 区 














jmp 指令 








jmp 指令 将 程序 无 条 件 地 跳 转 到 第 1 操作 数 指定 的 位 置 。 最 常用 的 做 法 是 使 用 由 标签 定义 





k un 


的 符号 (symbol), 5 “jmp 符号 ”。 
使 用 jmp 指令 的 例子 如 下 所 示 。 








movl $1, %eax 4 then 354) 

jmp end if0 E 跳 转 到 if 语句 的 末尾 
else0 : 

movl $4, %eax # else 部 分 
end if0: 

pushl %eax # if 语句 后 面 的 语句 




















call printf 


可 以 将 jmp 视 作 设置 指令 指针 (eip 寄存 需 ) 的 指令 。 例 如 上 述 例子 中 的 jmp end ifo, 
汇编 后 的 机 器 语言 会 将 end_if0 替换 为 程序 代码 的 地 址 ( 数据 )。 通 过 将 jmp ena ifo 的 地 
址 设置 到 eip 寄存 器 来 控制 程序 的 流程 。 
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编译 中 间 代 码 的 Jump 节点 时 就 可 以 使 用 jmp 指令 。 
F3 条 件 跳 转 指令 (jz、jnz、je、jne、…… ) 
条 件 跳 转 指令 有 多 个 ， 这 里 仅 以 jnz 指令 为 例 进行 说 明 。 其 他 跳 转 指令 的 用 法 和 jnz 相同 。 
jnz 立即 数 
jnz 寄存 器 





jnz 等 条 件 跳 转 指令 只 有 在 满足 特定 条 件 的 情况 下 ， 才 会 将 程序 跳 转 到 由 第 1 操作 数 指定 
的 位 置 。 例 如 jnz 指令 是 Jump if Not Zero 的 简称 ， 因 此 仅 当 标志 寄存 器 eflags 中 的 ZF (Zero 
Flag) 为 0 时 才 实 施 跳 转 。 

在 编译 中 间 代 码 的 cdump 节点 时 会 用 到 条 件 跳 转 指 令 。 例 如 ， 在 允 
lab 标签 ”这 样 的 CJump 节点 时 ， 就 会 用 到 jnz 指令 ， 如 下 所 示 。 





译 











“ 当 x==y 时 跳 转 到 



































movil y 的 地 址 ， %ecx # 将 变量 y 的 值 加 载 到 ecx 
movl x 的 地 址 ， %eax # 将 变量 x 的 值 加 载 到 eax 
cmp $ecx, %eax # 比较 并 设置 标志 位 

jnz lab # 不 相等 的 话 跳 转 到 Lab 









































emp 指令 是 比较 两 个 数据 并 设置 eflags 的 各 个 标志 位 的 指令 。 在 x 和 yy 的 值 不 相等 的 情况 


1， 跳 转 不 会 被 执行 ， 直 









































下 ， 如 果 调 用 cmp 指令 ，ZF 就 会 被 置 0， 从 而 执行 跳 转 。 
反之 ,在 x 和 y 相等 的 情况 下 ， 如 果 调用 cmp 指令 ，ZF 就 会 被 轩 
接 执行 jnz 后 面 的 指令 。 
条 件 跳 转 指令 存在 如 表 13.7 所 示 的 这 些 变化 形式 。 
表 13.7 条 件 跳 转 指令 
指令 全 名 跳 转 执行 的 条 件 
jz Jump if Zero ZF=1 
jnz Jump if Not Zero ZF=0 
je Jump if Equal ZF21 
jne Jump if Not Equal ZF=0 
ja Jump if Above CF=0 and ZF=0 
jna Jump if Not Above CEF=1TOFZF=1 
jae Jump if Above or Equal CF20 
jnae Jump if Not Above or Equal GF=1 
jb Jump if Below CF=1 
jnb Jump if Not Below CF=0 
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指令 全 名 跳 转 执行 的 条 件 
jbe Jump if Below or Equal CFz21 or ZF-1 
jnbe Jump if Not Below or Equal CF=0 and ZF=0 
jg Jump if Greater ZF=0 and SF=OF 
jng Jump if Not Greater ZF=1or SF!IZOF 
jge Jump if Greater or Equal SF=OF 

jnge Jump if Not Greater or Equal SFI=OF 

jl Jump if Less SFIZOF 

jnl Jump if Not Less SF-OF 

jle Jump if Less or Equal ZF=1 or SFI=OF 
jnle Jump if Not Less or Equal ZF=0 and SFZOF 








仅 看 跳 转 条 件 的 标志 位 可 能 无 法 理解 指令 的 意图 , i 
(Jump if Above )， 可 以 想象 它 表 示 “ 当 emp 的 第 2 操作 数 比 第 
表示 数据 的 大 小 时 有 above/below 和 greater/less 这 2 套 方 式 ， 


并 跳 转 ，greater/less 用 于 
另外 , 像 jz 和 je、 
选用 适当 的 指令 名 称 即 可 。 











ZF., CF 等 标志 位 可 以 通过 下 面 i 


cmp 指令 














解 的 cmp 指令 








符号 数 的 比较 并 跳 转 。 
jnz 和 jne 等 ,， 这些 只 是 完全 相同 的 指令 的 不 同名 称 。 根 据 使 用 场景 








青 结 合 指令 的 名 称 来 理解 。 例 如 ja 


1 操作 数 大 (above ) 时 跳 转 ”。 
above/below 用 于 无 符号 数 的 比较 


或 test 指令 进行 设置 。 











cmp 立即 数 ， 寄 存 器 | 
cmp 寄存 器 ， 寄 存 器 

cmp 内 存 ， 寄 存 器 

cmp 立即 数 ， 内 存 

cmp 寄存 器 ， 内 存 J 





cmp 指令 通过 比较 第 2 操作 数 减 去 第 
标志 位 。cmp 指令 本 质 上 和 sub 指 





1 操作 数 的 差 ， 根 据 结 果 设 置 标志 寄存 咒 eflags 中 的 





操作 数 和 所 设置 的 标志 位 之 间 的 关系 如 表 13.8 所 示 。 


表 13.8 使 用 cmp 指令 


令 相 同 ， 只 是 cmp 指令 不 会 改变 操作 数 的 值 。 














操作 数 的 关系 CF ZF OF 

第 1 操作 数 < 第 2 操作 数 0 0 SF 

第 1 操作 数 = 第 2 操作 数 0 1 0 

第 1 操作 数 > 第 2 操作 数 1 0 not SF 
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例如 ， 当 第 1 操作 数 和 第 2 操作 数 相 等 时 ， 如 果 执 行 cmp 指令 ，ZF 就 会 被 置 1。 紧 接着 再 
使 用 jz 指令 (ZF=1 时 才 跳 转 )， 就 能 够 实现 当 数据 相同 时 进行 跳 转 。 


test 指令 


立即 数 ， 寄 存 器 
寄存 器 ， 寄 存 器 











立即 数 ， 内 存 
寄存 器 ， 内 存 








test 指令 通过 比较 第 1 操作 数 和 第 2 操作 数 的 逻辑 与 (bitwise AND )， 根 据 结果 设置 标志 
寄存 器 eflags 中 的 标志 位 。test 指令 本 质 上 和 and 指令 相同 ， 只 是 test 指令 不 会 改变 操作 
数 的 值 。 

test 指令 执行 后 CF 和 OF 通常 会 被 清 0， 并 根据 运算 结果 设置 ZF 和 SF。 运 算 结果 为 0 
时 ZF SEE, SF 和 最 高 位 的 值 相同 。 

test 指令 可 用 于 检查 特定 的 位 是 否 被 置 位 等 。 以 C 语言 为 例 ， 在 检查 1iE (flags & 
EOF FLAG) 这 样 的 条 件 时 ， 就 可 以 使 用 test 指令 。 



































标志 位 获取 指令 ( SETcc ) 


获取 标志 位 的 指令 有 很 多 ， 这 里 仅 以 sete 指令 为 例 ， 介 绍 一 下 其 使 用 方法 ， 其 他 的 标志 
位 获取 指令 的 用 法 和 sete 完全 相同 。 


sete 寄存 器 

sete 内 存 

sete 等 一 系列 标志 位 获取 指令 根据 标志 寄存 咒 eflags 的 值 ， 将 第 1 操作 数 设置 为 0 或 1。 
例如 sete 指令 就 是 将 ZF 的 值 设置 到 第 1 操作 数 。 这 一 系列 的 指令 统称 为 SETcc。 


SETcc 中 的 cc 和 条 件 跳 转 指令 的 后 缀 相同。 其中， 本 书 中 用 到 的 指令 如 表 13.9 所 示 。 
表 13.9 本 书 中 涉及 的 SETcc 指令 












































指令 名 称 含义 

sete Equal ZE=1 

setne Not Equal ZF=0 

seta Above CF=0 and ZF=0 
setae Above or Equal CF=0 
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指令 名 称 含义 

setb Below CF-21 

setbe Below or Equal CF=1 or ZF=1 
setg Greater ZF=0 and SFZOF 
setge Greater or Equal SF=OF 

setl Less SFIZOF 

setle Less or Equal ZF=1 or SFI=OF 











SETcc 指令 通常 和 emp 指令 组 合 使 用 。cmp 指令 后 立即 执行 SETcc 指令 就 能 获取 数据 比较 
的 结果 。 例 如 用 cmp 指令 比较 eax 寄存 器 和 ecx 寄存 器 的 值 之 后 ， 调 用 sete 指令 获取 比较 结 
果 ， 就 能 取得 表示 eax 寄存 器 和 ecx 寄存 器 是 否 相等 的 0/1。 

另外 ， 和 条 件 跳 转 指令 相同 ，SETcc 指令 示 也 有 above/below 和 greater/less 这 2 套 表 示 数 据 
大 小 的 方式 。above/below 用 于 获取 无 符号 数 的 比较 结果 ，greater/less 用 于 获取 有 符号 数 的 比较 
结果 。 


call 指令 


call 立即 数 
call 寄存 器 
call 内 存 
































call 指令 会 调用 由 第 1 操作 数 指定 的 函数 。 最 常见 的 做 法 是 利用 符号 将 代码 写成 cal1l 
printf 或 call f 的 形式 。 还 可 以 使 用 寄存 器 中 设置 的 函数 指针 ， 通 过 call *%eax HÍT A 
数 调用 。 

使 用 ca11 指令 的 例子 如 下 所 示 。 

















call printf 4 调用 通过 符号 ( 立即 数 ) 定义 的 printf 函数 
call *Seax — 4 利用 eax 中 设置 的 函数 指针 进行 函数 调 


HERH, call 指令 可 以 分 解 为 以 下 2 个 指令 。 
































pushl $next insn 
jmp 第 1 操作 数 
next insn: 
也 就 是 说 ,将 call 指令 的 下 一 条 指令 的 地 址 压 栈 ， 再 跳 转 到 第 1 操作 数 指定 的 地 址 。 这 
样 函 数 就 能 通过 跳 转 到 栈 上 的 地 址 从 子 函 数 返 回 。 
函数 调用 的 相关 内 容 将 在 第 14 章 详细 说 明 。 
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ret 指令 








( ret | 
ret 指令 用 了 


于 从 子 函 数 返回 。x86 架构 的 Linux 中 是 将 函数 的 返回 值 设置 到 eax 寄存 能 并 返 
回 的 。 


使 用 ret 指令 的 例子 如 下 所 示 。 




















ret # 从 子 函 数 返 区 











ret 指令 等 价 于 下 面 这 样 的 处 理 。 


popl šeip 


也 就 是 说 ， 将 先前 call 指令 压 栈 的 “call 指令 下 一 条 指令 的 地 址 ”弹出 栈 ， 并 设置 到 指 
令 指针 中 。 这 样 程序 就 能 正确 地 返回 到 调用 子 函 数 的 地 方 。 








本 章 我 们 将 从 汇编 语言 的 层面 讲解 函数 调用 相关 
的 内 容 。 
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程序 调用 约定 








本 节 将 对 调用 函数 时 所 必需 的 “程序 调用 约定 ”进行 简单 的 讲解 。 


F3 什么 是 程序 调用 约定 


本 章 主 要 讲解 函数 调用 的 相关 内 容 ， 在 讲解 其 实现 机 制 之 前 ， 我 们 先 要 了 人 解 函 数 的 规范 和 
地 征 。 举 个 例子 ，C 语言 里 的 函数 有 如 下 特征 。 







































































e 可 以 向 函数 传递 参数 

e 函数 的 参数 类 型 可 以 是 数值 、 指 针 、 构 造 函数 等 

e 可 以 定义 printf 函数 这 种 可 接收 不 定 个 数 参数 的 函数 

e 拥有 只 能 在 特定 函数 内 部 访问 的 局 部 变量 

e 执行 return 语句 可 以 跳出 被 调用 函数 ， 回 到 原 处 理 流程 























这 样 的 规范 都 由 编程 语言 本 身 约定 ， 不 会 因为 CPU 或 者 OS 的 不 同 而 改变 。 不 过 ， 在 不 
同 的 CPU 或 者 OS 下， 这 些 规范 的 实现 方法 往往 有 所 不 同 。 壁 如 参数 传递 的 实现 ， 既 有 把 参 
数 保存 到 寄存 器 来 传递 的 方法 ， 也 有 把 参数 入 栈 来 传递 的 方法 。 而 程序 的 调用 约定 (calling 
convention ) 就 是 根据 CPU 和 OS 来 决定 函数 调用 的 具体 实现 方法 的 约定 。 

这 里 之 所 以 没有 用 “函数 调用 约定 ”而 用 “程序 调用 约定 ”， 是 因为 不 同 的 编程 语言 对 “ 画 
数 ” 名 称 的 定义 往往 不 尽 相 同 。 虽 然 “程序 ”这 个 词 也 不 一 定 适 用 于 所 有 语言 ， 但 比 “ 函 数 ” 
更 恰当 一 些 。 另 外 ， 有 的 文献 中 直接 用 “调用 约定 ”来 指 代 。 



































Linux/x86 下 的 程序 调用 约定 
接 下 来 具体 讲解 在 x86 CPU 架构 下 Linux 系统 中 的 程序 调用 约定 。 
在 程序 调用 约定 中 ， 通 常 定义 了 表 14.1 中 列举 的 内 容 。 

R 14.1 Linux/x86 下 的 程序 调用 约定 ( 摘要 ) 
















































































项 目 内 容 

参数 传递 方法 入 栈 传递 

返回 值 传 递 方法 FA eax 寄存 器 返 区 

返回 地 址 的 指定 方法 入 栈 传递 

标准 的 栈 帧 结构 按照 参数 、 返 回 地址 、 原 ebp、 局 部 变量 的 顺序 ( 参考 图 14.1 ) 
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( 续 ) 
项 目 内 容 
caller-save 寄存 器 eax、ecx、edx、esp 
callee-save 寄存 器 ebx, ebp, esi, edi 





! ' | 0 号 地 址 
| kr 一 esp ( 栈 顶 ) 


当前 执行 函数 的 栈 帧 








局 部 变量 1 
callee-save 寄存 器 的 值 


ebp 
发 起 函数 调用 的 原 函 数 的 栈 帧 


第 3 个 参数 






































y 原 ebp 
t [EUR ( 0xBFFFFFFF 号 地 址 ) 


图 14.1 Linux/x86 下 的 标准 的 栈 帧 结构 








当然 ， 单 单 罗列 上 面 这 些 信息 会 很 让 人 费解 。 下 一 节 中 将 会 结合 函数 调用 的 实际 步 台 ， 详 
细 地 解释 这 份 调用 约定 的 内 容 。 

另外 ，Linux/x86 下 的 调用 约定 已 在 LSB (Linux Standard Base ) ?中 明文 规定 ， 其 内 容 和 
System V ABI ( Application Binary Interface ) 的 IA-32 版 本 “一致 。 如 需 更 严谨 的 资料 ， 可 参考 
上 述 文献 。 














(D http:/refspecs.linuxfoundation.org/lsb.shtml。 





译 者 注 


@ "System V Application Binary Interface: Intel 386 Architecture Processor Supplement" Forth Edition 
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Linux/x86 下 的 函数 调用 











本 将 一 边 模拟 函数 调用 的 具体 步骤 一 边 进行 讲解 。 


到 函数 调用 完成 为 止 


为 了 让 大 家 有 更 直观 的 印象 ， 我 们 参考 一 下 下 面 这 段 C 语言 的 代码 ， 首 先 来 看 从 main K 
数 中 调用 函数 £ 的 过 程 。 








int 
iE (aene sx, aee 37) 
{ 
see JL 
= 
J =a MT 
setur a, 
} 
int 
main(int argc, char **argv) 


{ 


ashe 3L es yaa 


a e wa, LR 
i %= 5; 
return i; 


TE main 函数 中 调用 函数 上 时， 会 经 历 下 面 这 些 步 又 。 

1. £ 的 第 2 个 参数 ( 8 ) Ad 

2. £ 的 第 1 个 参数 ( i ) AR 

3. 执行 call f 指令 

经 过 这 3 个 步骤， 就 完成 了 函数 E 的 调用 过 程 。 这 个 时 候 ， 栈 的 信息 如 图 14.2 所 示 。 

这 里 需要 注意 的 是 ， 函 数 的 参数 是 从 后 (也 就 是 从 右边 ) 开始 ， 按 顺序 入 栈 的 。C 语言 标 
准 里 并 没有 规定 参数 的 执行 顺序 ， 不 过 一 般 C 语言 编译 器 的 做 法 都 是 把 参数 从 右 到 左 执行 ， 并 
且 逐 一 入 栈 。 
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，1 0 号 地 址 














main 函数 的 栈 帧 





ETT ( OXBFFFFFFF 号 地 址 ) 


图 14.2 ERS (1) 函数 f 调 用 完成 时 


参数 全 部 加 载 完毕 后 ， 下 一 步 是 执行 cal1 f 指令 完成 函数 £ 的 调用 。 也 就 是 说 ， 在 调用 
首 令 的 地 址 入 栈 后 ， 直 接 把 esp 寄存 器 的 值 设置 成 函数 £ 的 起 始 地 址 。 
到 这 一 步 时 ， 栈 的 状态 就 如 图 14.2 所 示 。 


m 到 函数 开始 执行 为 止 
这 时 ， 函 数 E 的 调用 已 经 完成 ， 但 函数 三 本 身 尚未 执行 。 在 执行 之 前 ， 需 要 为 函数 € 创建 
相应 的 栈 帧 。 通 常生 成 栈 帧 的 代码 如 下 所 示 。 





























pushl %ebp # ebp 寄存 器 的 值 入 栈 
movil $esp, %ebp # 把 esp 寄存 器 的 值 存 入 ebp 寄存 器 
subl $8, $esp # esp 寄存 器 的 值 减 去 8 (ŽAR ) 

这 段 代码 的 意思 是 ， 函 数 调 用 时 将 ， ， 人 0 号 地 址 
ebp 寄存 器 的 值 ( 原 函 数 的 epp 的 值 ) 入 | t—esp (ER) 
栈 保 存 后 ， 把 ebp 寄存 右 的 值 设置 为 当前 

3 E43 g y 函数 f 的 栈 帧 
栈 顶 的 值 。 最 后 ， 从 esp 寄存 器 中 减 去 局 
部 变量 所 需要 的 大 小 ， 从 而 增 大 栈 。 由 于 T 


函数 £ 中 定义 了 两 个 int 型 的 局 部 变量 
因此 上 述 代码 中 用 esp 减 去 8，8 这 个 数 
值 会 根据 局 部 变量 的 类 型 和 大 小 而 改变 。 
到 此 为 止 ， 栈 的 状态 如 图 14.3 所 示 。 
这 时 栈 帧 的 准备 已 经 完成 。 之 后 就 可 
以 执行 函数 E 本 身 的 代码 了 。 | 
函数 的 参数 以 及 返回 地 址 都 属于 l | Bui ( 内 存 地 址 OXBFFFFFFF | 

“ 原 ” 函 数 的 栈 帧 ， 这 一 点 需要 注意 。 这 图 14.3 ARE (2 ) 栈 帧 生成 后 

















main 函数 的 栈 帧 











i 
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些 值 并 没有 保存 到 被 调用 函数 的 栈 帧 里 。 另 外 ， 访 问 参 数 需 要 基于 ebp 寄存 器 进行 间接 访问 。 
ETD, RKA E 的 第 1 个 参数 需要 通过 8 (sebp) 这 样 的 形式 进行 访问 。 

如 上 所 述 ， 在 函数 开始 执行 前 用 作 初 始 化 的 代码 叫 序言 (prologue )。 相 应 地 ， 在 函数 执行 
结束 后 运行 的 代码 叫 尾声 ( epilogue )。 


FJ 到 返回 原 处 理 流程 为 止 
通常 ， 结 束 函 数 调用 的 代码 ( 尾声 ) 如 下 所 示 。 




















movl $ebp, $esp 
popl %ebp 
els 


首先， 把 esp 寄存 带 置 为 ebp 寄存 顺 的 值 ， 释 放 当 前 栈 帧 。 

其 次 ,执行 popl sebp， 把 ebp 寄存 融 的 值 复原 为 调用 函数 开始 时 保存 的 、 原 处 理 流程 的 
ebp 寄存 怖 的 值 。 

最 后 ， 执 行 ret 指令 ， 把 返回 地 址 保存 到 eip 寄存 带 中 ， 返 回 原 处 理 流程 。 

另外 ， 如 果 函 数 有 返回 值 ， 那 么 在 执行 这 段 代码 之 前 ， 需 要 把 返回 值 保存 到 eax 寄存 带 中 。 

执行 完 这 些 步骤 之 后 ， 隐 数 E 的 栈 帧 清空 ， 栈 的 状态 如 图 14.4 所 示 。 











' lo 号 地 址 
&— esp 
第 1 个 参数 (i) 
第 2 个 参数 (8 ) main 函数 的 栈 帧 
ebp 





， | BU (OXBFFFFFFF 号 地 址 ) 
14.4. 栈 状态 ( 3 ) 函数 尾声 执行 后 


到 清理 操作 完成 为 目 


至 此 ， 程 序 已 返回 原 处 理 流程 。 不 过 ， 原 先 为 向 函数 £ 传递 参数 而 保存 到 栈 中 的 数据 依然 
存在 。 这 些 数 据 在 原 处 理 流 程 ( 此 处 是 main 函数 ) 中 必须 显 式 地 删除 。 为 达到 这 个 目的 ,在 
main 函数 的 代码 中 需要 执行 下 列 语句 ， 增 加 esp 寄存 器 的 值 ， 从 而 压缩 main 函数 的 栈 帧 。 





























addl $8, $esp 


此 时 栈 的 状态 如 图 14.5 Biz, sé CR SU Y PRIORE BUSH 
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， 人 内 存 地 址 0 


| | esp 
i *— ebp 


| 栈 底 ( 内 存 地 址 OXBFFFFFFF ) 
145 IRS ( 4 ) 参数 释放 后 


F3 函数 调用 总 结 
接 下 来 以 汇编 代码 为 中 心 ， 再 来 梳理 一 下 从 调用 函数 于 到 返回 main KJE. MATAT 


iR, Æ main 函数 中 调用 函数 £ 的 C 语 言 代 码 为 £(i，8)。 
main KIRK £ —"——: 


























* 序言 ( 生成 栈 帧 ) 
pushl %ebp 








movil S$esp, $ebp 

subl $8, S$esp 

函数 工 4585 

# 尾声 ( (RRM, KE esp, ebp 和 eip ) 
movl $ebp, $esp 

popl %ebp 

FEE 


main: 














main BEARES 调用 函数 荆 前 ) 














# 调用 函数 和 

pushl $8 

movl 8(S$ebp), $eax 
pushl $eax 

call E 


addl $8, S$esp 

















main 函数 本 身 的 代码 调用 函数 于 后 ) 





KAA main 函数 中 “调用 函数 £” 的 地 方 。 要 调用 函数 ， 首 先 要 把 函数 的 参数 从 后 到 前 
顺序 入 栈 。 

先 执行 语句 pushl $8 使 第 2 个 参数 8 人 栈 。 接 着 执行 mov ft. TE eax 寄存 需 中 载 和 本 
地 变量 i 的 值 ， 执 行 push 指令 使 eax 寄存 器 的 值 和 人 栈 。 也 就 是 把 第 1 个 参数 i ARE 

这 时 函数 调用 的 前 期 准备 已 经 完成 ， 接 下 来 可 以 执行 call £ 语句 调 用 也 数 £。 在 执行 
call 指令 的 同时 ， 把 返回 地 址 人 栈 ， 并 把 eip 寄存 需 的 值 设置 为 函数 £ 的 起 始 地 址 ， 从 而 转 入 
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函数 E 的 处 理 流程 中 去 。 
在 开始 执行 函数 £ 前 ， 首 先 会 执行 函数 £ 的 序言 代码 ， 生 成 函数 调用 所 需 的 栈 帧 。 函 数 的 
序言 代码 如 下 所 示 。 
pushl %ebp 
movi S$esp, $ebp 
subl $8, Sesp 


Jett H push 指令 把 main 函数 的 ebp 的 值 压 入 栈 保存 起 来 。 
紧 接 着 使 用 mov 指令 ， 把 ebp 寄存 器 的 值 设 置 成 当前 esp 寄存 器 的 值 ( 栈 的 起 始 地 址 )。 
最 后 使 用 sub 指令 ,使 esp 寄存 器 的 值 减 去 8， 为 函数 E 的 栈 帧 腾 出 空间 。 








以 上 就 是 函数 E 的 序言 。 函 数 £ 本 身 会 在 序言 执行 之 后 被 执行 ， 其 返回 值 被 保存 到 eax 寄 





存 器 中 。 
在 函数 E 执行 结束 后 ， 执 行 如 下 所 示 的 尾声 代码 。 
movl %ebp, $esp 
popl %ebp 
nee 


先 使 用 mov 指令 把 esp 寄存 器 的 值 设 置 为 ebp 寄存 器 的 值 ， 释 放 函 数 芋 的 栈 帧 。 
接着 使 用 pop 指令 恢复 ebp 寄存 器 的 值 。 
最 后 执行 ret 指令， 返回 到 原 处 理 流 程 的 代码 中 。 








执行 ret 指令 后 ， 程 序 执行 的 流程 会 直接 返回 到 函数 调用 发 生 的 ca11 指令 后 面 。 在 本 例 





中 ， 就 是 返回 到 以 下 这 个 语句 。 
addl $8, gesp 
这 个 语句 把 esp 寄存 器 的 值 增加 8， 从 而 释放 掉 栈 中 保存 的 函数 £ 的 参数 。 
以 上 就 是 Linux/x86 下 函数 调用 的 步骤 。 下 一 节 会 接着 解说 函数 调用 相关 的 细节 。 
T 一 一 
enter 指令 和 leave 指令 





x86 架构 下 有 专门 用 来 生成 和 释放 栈 帧 的 指令 。 生 成 栈 帧 的 指令 为 enter 指令 ， 释 放 栈 帧 的 指 
SH leave 指令 。 
其 中 ，leave 指令 相对 常用 ， 而 enter 指令 则 极 少 被 使 用 。 这 是 因为 enter 指令 执行 速度 
慢 ， 甚 至 比 本 节 中 所 介绍 的 生成 栈 帧 的 方法 还 要 慢 。 为 了 支持 像 Pascal、Lisp 这 样 的 以 函数 定义 为 
核心 的 编程 语言 ，enter 指令 被 设计 得 非常 通用 ， 但 效率 不 高 。 
函数 的 序言 代码 并 不 非常 难 懂 ， 因 此 完全 可 以 避免 使 用 enter 指令 。 而 另 一 方面 ，leave 指 
令 往往 比 pop 和 mv 的 组 合 更 加 有 高 效 ， 因 此 非常 值得 积极 使 用 。 
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讲解 函数 调用 相关 的 内 容 。 


寄存 器 的 保存 和 复原 





如 第 12 章 


章 中 所 述 ，x86 刀 























架构 提供 了 6 个 可 随意 使 用 的 通用 寄存 器 。 这 里 需要 注意 的 是 ,在 














程序 运行 的 整个 生命 周期 里 能 够 使 用 的 寄存 咒 也 只 有 这 6 个 。 也 许 在 函数 调用 时 ， 原 处 理 流程 
会 在 寄存 器 中 写 人 临时 值 ; 或 者 反 过 来 ， 调 用 其 他 函数 并 且 返 回 时 ， 被 调用 的 函数 可 能 在 寄存 
顺 中 写 人 临时 值 。 


就 C 语言 来 说 ， 寄 存 器 























就 像 是 全 局 变量 一 样 。 因 为 是 全 局 变量 ， 所 以 我 们 很 难得 知 什么 时 











候 、 哪 一 个 函数 更 改 了 它 的 值 。 想 象 一 下 在 编程 的 时 候 定 义 6 个 全 局 变量 ， 只 用 这 些 变量 编写 





整个 程序 。 这 是 非常 困难 的 事 ' 





























要 怎样 做 才能 安全 地 访问 寄存 器 呢 ? 最 保险 的 方法 是 ， 每 次 在 调用 别 的 函数 前 ， 把 寄存 器 
的 值 保 存 到 栈 中 。 也 就 是 说 ， 在 函数 开始 执行 时 ， 把 所 有 寄存 顺 的 值 奈 栈 ， 而 在 函数 内 部 执行 
return 指令 返回 的 时 候 ， 把 寄存 带 的 值 出 栈 ， 恢 复 函 数 调用 前 的 状态 。 通 过 这 个 方法 ， 各 个 


函数 就 都 可 以 随意 使 月 



































HEU ESSE ERR T o 








这 个 方法 的 确 是 最 安全 的 ， 但 效率 非常 低 。 访 问 栈 等 价 于 访问 机 器 内 存 ， 和 单纯 使 用 寄存 
器 相 比 ， 访 问 内 存 的 速度 明显 下 降 。 因 此 ， 很 有 必要 花心 思 去 减少 栈 的 使 用 次 数 。 


首先 ， 要 注意 至 








| 并 不 是 所 有 寄存 需 的 值 都 需要 保存 。 之 所 以 要 保存 一 个 寄存 需 的 值 ， 是 因 














为 我 们 不 想 去 更 改 这 个 寄存 器 的 值 。 也 就 是 说 ， 如 果 是 函数 不 会 使 用 (不 会 变更 ) 的 寄存 央 
那么 这 个 寄存 器 的 值 就 不 用 保存 。 
此 外 ， 程 序 调用 约定 中 指定 了 callee-save AALIK caller-save 寄存 需 两 种 分 类 ， 以 最 大 


限度 地 重复 利 月 








日 寄存 器 。 利 月 





这 个 约定 ， 可 以 进一步 减少 访问 栈 的 次 数 。 


caller-save 寄存 器 和 callee-save 寄存 器 











caller-save 寄存 器 和 callee-save 寄存 器 是 程序 调用 约定 里 规定 的 关于 寄存 器 使 用 方法 的 规 
则 。 这 个 约定 把 所 有 的 寄存 器 分 为 caller-save 寄存 器 和 callee-save 寄存 器 两 类 ， 不 同类 别 的 寄 
存 器 使 用 方法 也 不 相同 。 
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Linux/x86 下 寄存 器 的 分 类 如 表 14.2 所 示 。 
表 14.2 寄存 器 的 分 类 











分 类 寄存 器 
caller-save 寄存 器 eax、ecx、edx、esp 
callee-save 寄存 器 ebx、ebp、esi、edi 











caller-save 寄存 器 ( caller-save register ) 指 的 是 为 函数 调用 方 保存 值 的 寄存 器 。 在 使 用 
caller-save 寄存 器 时 ， 调 用 其 他 函数 前 必须 把 寄存 器 的 值 保 存 到 内 存 ， 并 且 在 函数 调用 结束 后 恢 
复 寄 存 器 的 值 。 不 过 相应 地 ， 被 调用 函数 中 可 以 不 保存 这 个 寄存 器 的 值 ， 直 接 更 改 。 

换 句 话说 ，caller-save 寄存 吉 在 调用 其 他 函数 时 ， 其 保存 的 值 可 能 会 改变 。 也 就 是 说 ， 事 实 
上 这 类 寄存 器 的 值 会 经 常 发 生变 动 。 

而 callee-save 寄存 器 ( callee-save register ) 则 是 被 调用 函数 必须 显 式 保 存 寄存 器 的 值 的 寄 
存 器 。 也 就 是 说 ， 使 用 callee-save 寄存 器 的 函数 ， 必 须 在 函数 执行 开始 时 把 寄存 器 的 值 压 栈 保 
存 到 内 存 ， 并 且 在 函数 执行 结束 时 把 寄存 融 的 值 复原 。 

回想 一 下 前 面 介绍 过 的 函数 的 序言 和 尾声 。 在 序言 和 尾声 的 代码 中 ， 有 把 ebp 寄存 器 的 值 
压 栈 、 出 栈 的 指令 。 这 是 因为 ebp 寄存 器 本 身 是 个 callee-save A riro AXE PARA IPSI I ebp 
以 外 的 callee-save 寄存 器 ， 那 么 这 个 寄存 器 也 像 ebp 寄存 器 一 样 ， 需 要 进行 同样 的 压 栈 、 出 栈 
操作 。 






























































caller-save 寄存 器 和 callee-save 寄存 器 的 灵活 应 用 


那么 ， 怎 样 利用 caller-save 和 callee-save 的 分 类 来 减少 栈 的 访问 次 数 呢 ? 

首先 ， 要 注意 到 caller-save 寄存 器 是 调用 其 他 函数 时 必须 保存 值 的 寄存 器 ， 而 同时 也 是 使 
用 前 不 需要 保存 值 的 寄存 器 。 因 为 值 在 函数 调用 方 已 经 保存 ， 所 以 在 使 用 前 就 不 需要 再 保存 值 。 
也 就 是 说 ， 我 们 可 以 随时 更 改 caller-save 寄存 器 的 值 。 

另 一 方面 ，caller-save 寄存 器 的 值 在 调用 其 他 函数 时 有 可 能 发 生 改 变 ， 因 此 才 需 要 在 调用 其 
他 函数 前 把 值 保 存 起 来 。 不 过 ， 也 并 不 是 说 在 所 有 情况 下 都 必须 保存 值 。 如 果 在 调用 其 他 函数 
后 ， 不 再 需要 这 个 寄存 器 的 值 ， 那 么 就 不 需要 进行 保存 了 。 
由 以 上 特征 可 知 caller-save 寄存 需 适 合用 于 保存 临时 变量 。 特 别 是 如 果 只 是 计算 某 个 值 并 
将 其 作为 参数 传递 到 其 他 函数 的 话 ， 甚 至 不 需要 往 内 存 保存 任何 值 。 因 此 ， 计算 过 程 中 的 结 
只 在 函数 内 部 使 用 的 本 地 变量 等 的 值 都 可 以 保存 到 caller-save 寄存 顺 里 。 

而 callee-save 寄存 器 则 适用 于 保存 某 个 函数 内 一 直 需 要 访问 的 值 。 因 为 这 样 的 值 如 果 保 存 
到 caller-save 寄存 器 中 ， 那 么 在 每 次 调用 其 他 函数 时 ， 都 必须 进行 值 的 保存 和 恢复 操作 。 

举 个 例子 ， 帧 指针 (ebp 寄存 器 ) 就 是 一 个 代表 性 的 callee-save 寄存 器 。 在 访问 函数 的 参 
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数 、 本 地 变量 的 时 候 ， 帧 指针 会 被 反复 使 用 。 一 旦 把 这 样 的 值 保 存 到 caller-save 寄存 器 中 ， 就 
必须 对 这 个 值 反复 地 进行 “保存 到 内 存 ” 和 “从 内 存 里 恢复 ”的 操作 。 

总 结 一 下 caller-save 寄存 器 和 callee-save 寄存 器 的 使 用 方法 : caller-save 寄存 器 不 需要 保存 
和 恢复 原来 的 值 ， 因 此 适合 用 来 保存 临时 变量 、 生 命 周期 比较 短 的 值 等 ;而 callee-save 寄存 器 
在 调用 其 他 函数 的 时 候 不 需要 进行 值 的 保存 和 恢复 处 理 ， 比 较 适 用 于 保存 在 函数 内 一 直 使 用 的 
生命 周期 比较 长 的 值 。 


F3 大 数值 和 浮 点 数 的 返回 方法 


Linux/x86 的 程序 调用 约定 中 指定 把 返回 值 存 进 eax 寄存 器 后 返回 。 不 过 ，eax 寄存 器 只 占 
32 位 宽 ， 需 要 采用 特殊 的 办 法 才能 返回 超出 其 上 限 的 值 。 璧 如 long long 类 型 的 值 、double 
float 类 型 的 浮 点 数 、 结 构 体 等 最 少 需要 64 位 宽 的 值 。 

当然 ，Cb 中 没有 long long 类 型 、 浮 点 数 类 型 ， 函 数 也 不 能 直接 返回 结构 体 、 联 合体 ， 
因此 这 部 分 的 内 容 不 是 必需 的 ， 可 以 权 当 一 般 知识 来 了 解 。 

另外 ,无 论 什 么 样 的 数据 类 型 ， 作 为 参数 传递 的 时 候 都 只 需要 简单 地 压 栈 传递 即 可 ， 不 需 
要 进行 额外 的 处 理 。 

下 面 就 来 讲解 从 函数 体 中 返回 大 数值 的 方法 。 

首先 ， 返回 1ong long 类 型 的 值 时 ， 和 div 指令 的 处 理 一 样 ， 把 edx 寄存 器 和 eax 寄存 
器 连结 为 64 位 宽 的 寄存 器 来 使 用 。 也 就 是 说 ， 把 64 位 数值 的 高 32 位 保存 到 edx 寄存 器 ， 低 
32 位 保存 到 eax 寄存 器 并 返回 。 

其 次 ， 需 要 返回 浮 点 数 的 时 候 ， 可 以 把 数值 保存 到 st (o) 这 个 浮 点 数 寄存 器 中 。 这 种 情况 
下 不 需要 使 用 eax AIA o 

最 后 是 返回 结构 体 和 联合 体 的 情况 ， 这 两 种 情况 相对 比较 麻烦 。 返 回 结构 体 或 者 联合 体 的 
时 候 ， 需 要 函数 调用 方 和 函数 本 身 进行 协作 ， 有 具体 如 下 所 示 。 

1. 由 函数 调用 方 在 栈 上 申请 保存 返回 值 的 区 域 

2. 把 该 区 域 的 内 存 地 址 作为 第 1 个 参数 压 栈 

3. 被 调用 函数 把 返回 值 写 入 该 区 域 
4. 把 内 存 地 址 保存 到 eax 寄存 器 中 ， 并 且 执 行 ret $4 指令 

结构 体 和 联合 体 的 返回 机 制 有 些 混乱 ， 大 家 可 以 结合 图 形 来 理解 。 在 调用 返回 结构 体 或 联 
合体 的 函数 时 ，call 指令 执行 后 栈 的 状态 如 图 14.6 所 示 。 
通常 情况 下 第 1 个 参数 的 位 置 在 8 (sebp) ， 而 这 种 情况 下 第 1 个 参数 的 位 置 则 是 12 (%ebp) 。 

另外 ,返回 结构 体 或 联合 体 的 函数 在 执行 ret 指令 后 ， 需 要 把 图 14.6 中 “返回 值 区 域 的 地 
址 ”为 止 的 空间 从 栈 中 释放 掉 。 也 就 是 说 ， 必 须 恢 复 到 esp 寄存 器 指向 第 1 个 参数 的 状态 。 为 
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此 ， 需 要 执行 ret $4 指令 。 这 个 指令 在 执行 普通 的 ret 指令 的 基础 上 ， 把 esp 寄存 器 的 值 增 
加 4。 


; [o etit 


| | esp 
返回 值 区 域 的 地 址 












































:| 栈 底 ( 0xBFFFFFFF 号 地 址 ) 
图 14.6 在 调用 返回 结构 体 或 联合 体 的 函数 时 ，call 指令 执行 后 栈 的 状态 


其 他 平台 的 程序 调用 约定 


Linux/IA-32 的 程序 调用 约定 俗称 cdecl， 在 IA-32 架构 下 应 用 非常 广泛 。 事 实 上 ， 纵 观 
各 种 CPU、OS 后 就 可 以 发 现 ， 投 入 应 用 的 程序 调用 约定 数量 非常 可 观 。Windows 下 使 用 的 
stdcall、Linux/AMD64 下 使 用 的 fastcall ( 又 称 register call ) 等 就 是 典型 的 例子 。 

stdcall 和 cdecl 非常 类 似 ， 但 在 释放 栈 上 保存 的 参数 这 一 点 上 有 所 不 同 。cdecl 中 规定 函 
数 调用 方 释放 参数 ， 而 stdcall 中 则 指定 被 调用 函数 释放 参数 。stdcall 不 能 很 好 地 支持 类 似 于 
printf 这 样 的 参数 个 数 可 变 的 函数 ， 因 此 在 实现 C 语言 编译 器 时 应 用 cdecl 比较 方便 一 些 

fastcall 是 Linux/AMD64 下 使 用 的 程序 调用 约定 。 另 外 ，MIPS、SPARC 等 RISC CPU" 上 
也 使 用 类 似 的 约定 。fastcall 中 参数 的 头 几 个 会 使 用 寄存 器 来 传递 。 另 外 ,返回 地 址 也 会 保存 到 
寄存 器 中 进行 传递 。 

fastcall 的 设计 理念 是 尽 可 能 不 使 用 栈 ， 因 此 一 般 情 况 下 比 cdecl, stdcall 速度 更 快 。 不 过 ， 
fastcall 使 用 的 寄存 器 数目 比 cdecl 要 多 得 多 ， 所 以 它 并 不 适用 于 像 IA-32 这 样 的 通用 寄存 器 很 少 

的 架构 。 



































译 者 注 








编译 表达 式 和 语句 


本 章 将 利用 cbc 工具 解说 表达 式 和 语句 的 编译 
过 程 。 
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在 解说 源 代码 之 前 ， 本 节 移 来 介绍 如 何 确认 表示 编译 结果 的 汇编 代码 。 


利用 cbc 进行 确认 的 方法 


本 章 将 基于 源 代 码 讲解 将 中 间 代 码 编译 到 汇编 语言 的 方法 。 不 过 ， 要 理解 这 个 过 程 ， 无 论 
如 何 都 要 先知 道 怎样 确认 执行 结果 。 因 此 这 里 首先 介绍 一 下 如 何 确认 cbe 生成 的 汇编 代码 。 

如 果 像 下 面 一 样 ， 不 加 任何 选项 使 用 cbe 处 理 . cb 文件 ， 就 会 自动 编译 这 个 文件 生成 汇编 
文件 。 汇 编 文 件 的 文件 名 就 是 将 . cb 文件 的 后 缀 蔡 换 成 . s 所 得 到 的 。 




















































































































$ cbc hello.cb 
$ 1s 
hello hello ecb hello.o hello s 


如 果 想 确认 编译 的 结果 ， 那 么 只 需要 编译 .cb 文件 就 可 以 了 。 











除 此 以 外 ， 要 使 用 cbe 编译 得 到 汇编 代码 ， 还 可 以 使 用 如 表 15.1 所 示 的 选项 。 
表 15.1 编译 输出 汇编 代码 的 cbc 的 选项 




































































选项 效果 
-S 输出 .s 文件 后 退出 
--print-asm 把 汇编 代码 输出 到 标准 输出 后 退出 





另外 ， 还 有 一 个 非常 方便 的 选项 -fverbose-asm, 使 用 该 选项 可 以 往 汇 编 代 人 码 里 插入 注 
释 。cbc 加 上 -fverbose-asm 选项 后 编译 .cb 文件 ， 可 以 得 到 类 似 下 面 的 结 


$ cbc --print-asm -Everbose-asm hello.cb 
.file ubesovelt 


.Section .rodata 
De 

.String "Hello, World! Wn" 

o Tbe 
.globl main 

.type main,efunction 
main: 


# ---- Stack Frame Layout ----------- 
# (Sebp): return address 

4 4($ebp): saved $ebp 

4 8(%ebp): argc 
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本 
pushl %ebp 
movl %šesp, %ebp 
4 line 6: printf("Hello, World!Nin"); 
m Ge 4 
Sos d 
movil $.LCO, $eax 
"Jj 
pushl $eax 
call printf 
addl $4, S$esp 
# } 
S line 7: return 0; 
m onm d 
movi $0, $eax 
# } 
jmp BIO) 
ab) 
movil S$ebp, $esp 
pop! %ebp 
net 


.Size main,.-main 





如 上 所 述 , 加 上 -fverbose-asm 选项 进行 编译 后 ， 结 果 中 将 显示 汇编 代码 所 对 应 的 Cb 
代码 、 中 间 代 码 节点 等 信息 ， 这 样 一 来 就 可 以 简单 地 确认 本 章 中 介绍 的 汇编 结果 了 。 

此 外 ， 由 于 使 用 -fverbose-asm 选项 时 还 会 输出 栈 帧 的 状态 ， 因 此 也 可 以 很 容易 地 确认 
第 16 章 中 介绍 的 局 部 变量 分 配 的 结 


利用 gcc 进行 确认 的 方法 
下 面 介绍 如 何 使 用 gee 确认 C 语言 源 代码 的 编译 结果 。gcec 可 以 用 于 和 cbe 的 编译 结果 作 比 
较 ， 也 可 以 用 于 查看 cbe 本 身 没有 实现 的 功能 的 编译 结果 。 
在 没有 加 上 任何 选项 的 情况 下 用 gcc 编译 C 语言 的 源 代 码 ， 那么 build 结束 后 汇编 文件 将 被 
删除 。 不 过 如 果 像 下 面 一 样 加 上 -s 选项 来 处 理 C 语言 代码 ， 那么 gee 会 在 生成 汇编 文件 后 停 
止 处 理 ， 这 样 就 可 以 确认 编译 结果 






















































































$ gcc -S hello.c 
$ 1s 
hello.c hello.s 


另外 ，gcc 虽然 没有 像 cbc 一 样 的 --print-asm 选项 ,但 可 以 通过 在 -s 选项 后 添加 -o -, 
把 汇编 代码 输出 到 标准 输出 中 。 








$ gcc -S -o - hello.c 
.file "hello. 
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.Section .rodata 
-LLCO 
.String "Hello, World!" 
o TEE 
.globl main 


.type main, Gfunction 


( 以 下 省 略 ) 





pans 

















当 对 程序 的 编译 过 程 感到 困惑 时 ， 可 以 使 用 这 些 选 项 进行 编译 ， 并 查看 结果 。 
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x86 汇编 的 对 象 与 DSL 











本 节 将 介绍 依赖 CodeGenerator 类 的 x86 汇编 ， 以 及 生成 这 种 汇编 的 DSL。 


地 表示 汇编 的 类 

cbe 用 对 象 的 形式 来 表示 其 后 成 的 汇编 代码 结构 ， 所 以 我 们 姑且 把 这 些 对 象 称 为 汇编 对 象 。 

cbc 中 生成 汇编 对 象 的 类 有 如 下 3 种 。 

1. 表示 程序 的 类 

2. 表示 指令 的 操作 数 的 类 

3. 表示 字面 量 的 类 

下 面 按 顺序 解说 。 

首先 , “表示 程 序 的 类 ”用 于 表示 汇编 语言 的 4 种 语法 结构 ， 也 就 是 标签 、 汇 编 伪 操作 、 指 
令 、 注 释 。 代 码 清单 15.1 中 列举 了 这 些 类 。 
代码 清单 15.1 ”表示 汇编 语言 程序 的 类 


Assembly 
Comment 










































































Directive 

Instruction 

Label 
AssemblyCode 


Comment, Directive, Instruction, Label 分 别 表 示 其 名 称 所 示 的 语法 。 另 外 ， 管 
理 这 些 类 的 实例 列表 的 类 则 是 AssemblyCode 类 。 

其 次 ,“ 表 示 指 令 的 操作 数 的 类 ”用 于 表示 立即 数 、 寄 存 器 、 内 存 引 用 等 。 代 码 清单 152 
中 列举 了 这 些 类 。 
代码 清单 15.2 ”表示 指令 的 操作 数 的 类 


Operand 
ImmediateValue 
MemoryReference 
DirectMemoryReference 
IndirectMemoryReference 








Register 
AbsoluteAddress 
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ImmediateValue 类 表示 立即 数 ，DirectMemoryReference 类 表示 直接 内 存 引用 ， 
IndirectMemoryReference 类 表示 间接 内 存 引 用 ，Registet 类 表示 寄存 需 。 
AbsoluteAddress 类 稍微 特别 一 些 。 这 个 类 在 通过 函数 指针 调用 号 数 时 会 用 到 ， 壁 如 
call *$eax 中 的 *%eaxo 
最 后 ,“ 表 示 字 面 量 的 类 ”用 于 表示 数值 和 符号 。 代 码 清单 15.3 中 列举 了 这 些 类 。 
代码 清单 15.3 ”表示 汇编 语言 的 字面 量 的 类 ( 带 * 的 是 接口 ) 
Literal* 
IntegerLiteral 
Symbol* 
BaseSymbol 
NamedSymbol 


UnnamedSymbol 
SuffixedSymbol 

















IntegerLiteral 类 用 于 表示 立即 数 ，Symbol 接口 用 于 表示 符号 。 根 据 符 号 的 不 同 ， 具 
体 类 也 不 一 样 。 例 如 Cb 源 代码 中 出 现 过 的 函数 名 等 就 是 Namedsymbol, 诸如 “.L0” 这 样 的 
CodeGenerator 内 部 生成 的 符号 则 是 UnnamedSsymbol。 此 外 ,第 21 章 中 介绍 的 地 址 无 关 代码 v 
中 所 用 到 的 带 后 级 的 符号 用 suffixedSymbol 类 来 表示 。 

以 上 就 是 cbe 中 表示 汇编 语言 的 类 和 集合。 这 些 类 的 定义 都 直接 和 相应 的 语法 结构 一 一 对 应 。 


表示 汇编 对 象 


要 想 知道 cbe 对 照 汇 编 语言 生成 了 怎样 的 对 象 ， 最 简单 的 办 法 就 是 把 这 些 对 象 的 实际 结构 
表示 出 来 。 像 下 面 这 样 给 cbe 加 上 --dump-asm 选项 去 处 理 Cb 文件 ， 就 可 以 把 cbe 内 部 生成 
的 汇编 对 象 表示 出 来 。 















































$ cbc --dump-asm hello.cb 
(Directive ".fileWNtV"hello.cbV'") 
(Directive ".sectionWMt.rodata") 
(Label (NamedSymbol ".LC0")) 
(Directive ".string Nt V"Hello, World!WnV"") 
(Directive ".text") 
(prec Bre lo mag 
(Directive ".type\tmain,@function") 

(Label (NamedSymbol "main")) 

(Instruction "push" "l1" (Register BP INT32) 

(Instruction "mov" "l1" (Register SP INT32) (Register BP INT32)) 
( 
( 
( 
( 





Instruction "mov" "1" (ImmediateValue (NamedSymbol ".LC0")) (Register AX INT32) 
Instruction "push" "l1" (Register AX INT32)) 

Instruction "call" "" (pirectMemoryReference (NamedSymbol "printf"))) 
Instruction "add" "l1" (ImmediateValue (IntegerLiteral 4)) (Register SP INT32) 








(D 地 址 无 关 代 码 (PIC, Position-Independent Code ). 译 者 注 
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(Instruction "mov" "l1" (ImmediateValue (IntegerLiteral 0)) (Register AX INT32)) 
(Instruction "jmp" "" (DirectMemoryReference (UnnamedSymbol Gcac268))) 

(Label (UnnamedSymbol Gcac268)) 

(rnstruction "mov" "I" (Register BP INT32) (Register SP INT32)) 

(Instruction "pop" "l1" (Register BP INT32)) 

RS Ge 

(Directive ".sizeWNtmain,.-main") 





ixi HURTS AR UH IH ELA EOKE, fi m 8— 1 HRRIUEUS m. I (Instruction 
"push" "1" ...) 就 表示 1 个 Instruction 对 象 ，(Register BP INT32) 则 表示 1 个 
XS 

A cbe 加 上 --print-asm 选项 后 就 可 以 输出 上 述 汇编 对 象 对 应 的 汇编 语言 的 源 代码 。 通 
过 比较 这 两 者 ， 可 以 很 简单 地 掌握 汇编 对 象 的 内 部 结构 。 
































.file "hello.cb" 


.Section .rodata 
"Eme OE 

Tsering "Hello, World! Wn" 

.text 
.globl main 

.type main,Gfunction 
main: 

pushl sebp 

movil S$esp, $ebp 

movil $.LCO, $eax 

pushl $eax 

call printf 

addl $4, S$esp 

movil $0, $eax 

jmp .L0 
he 

movil $ebp, $esp 

popi Sebp 

ret 


.size main, .-main 














不 过 ，- -dump -asm 选项 输出 的 结果 和 汇编 语言 相 比 可 读 性 不 高 ， 因 此 如 果 需 要 确认 编译 
结果 ， 还 是 使 用 - -print-asm 选项 方便 一 些 。 




















15.3 cbc 的 x86 ; 








cbc 的 x86 汇编 DSL 








本 节 将 介绍 cbe 生成 汇编 对 象 的 方法 。 


利用 DSL 生成 汇编 对 象 




















CodeGenerator 类 使 用 下 列 代码 生成 汇编 对 象 。 

















as.mov(imm(0), dx()); 
H}, as 是 AssemblyCode 实例 。 这 个 代码 生成 的 汇编 对 象 如 下 所 示 。 


(Instruction "mov" "l1" 
(ImmediateValue (IntegerLiteral 0)) 
(Register DX INT32)) 


另外 ， 这 个 汇编 对 象 对 应 如 下 汇编 代码 。 
































movil $0, $edx 











可 以 拿 最 初 的 代码 和 生成 的 汇编 代码 对 比 着 看 一 下 。 这 两 者 契合 度 非常 高 ， 因 而 可 以 很 容 











易 看 出 会 生成 怎样 的 目标 代码 。 
再 介绍 一 个 别 的 例子 。 下 列 代码 表示 把 ebp 寄存 如 的 内 容 压 栈 。 


file.push(bp()); 


这 名 代码 对 应 的 汇编 代码 如 下 所 示 。 




















pushl Sebp 


大 家 应 该 很 容易 发 现 这 两 名 代码 之 间 的 联系 。 





由 于 封装 了 mov, imm 等 方法 ， 因 此 cbe 可 以 用 非常 简洁 、 易 懂 的 方式 来 解释 x86 汇编 语 











Ho HAW, cbe 就 是 基于 Java 这 个 编程 语言 的 专门 表示 汇编 语言 的 特定 语言 。 

















类 似 的 专门 处 理 特 定 问 题 、 可 以 用 简洁 的 代码 描述 和 处 理 问 题 的 语言 就 是 DSL. (Domain 
Specific Language ， 领 域 专 用 语言 )。cbc 的 CodeGenerator 就 利用 了 x86 汇编 的 DSL。 
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接 下 来 介绍 一 下 cbe 中 实现 的 x86 汇编 DSL 894855. 


首先 ，CodeGenerator 类 中 定义 了 如 表 15.2 所 示 的 返回 Register 实例 的 方法 。 


表 15.2 描述 寄存 器 的 DSL 


















































六 大 含义 
ax() 96eax 
bx() 96ebx 
cx() 96ecx 
dx() 96edx 
si) 96esi 
di( 96edi 
spl) %esp 
bpl) %ebp 
ax(t) 保存 类 型 t+ 大 小 的 ax 寄存 器 
cx(t) 保存 类 型 t+ 大 小 的 cx 寄存 器 
al() 96al ( eax 寄存 器 的 最 后 8 位 ) 
ci() 96cl ( ecx 寄存 器 的 最 后 8 位 ) 











下 面 看 看 这 些 方法 的 实现 。ax (t) 和 bx(t) 方法 的 实现 如 代码 清单 15.4 所 示 。 


代码 清单 15.4 ”描述 寄存 器 的 方法 集合 (sysdep/x86/CodeGenerator.java) 


private Register ax(Type t) { 
return new Register(RegisterClass.AX, t); 


) 


private Register bx(Type t) { 
return new Register(RegisterClass.BX, t); 


) 


以 上 两 个 方法 都 只 是 单纯 地 生成 并 返回 一 个 Register Xj, RegisterClass Æ enum 


类 型 ， 对 应 不 同 的 寄存 器 有 AX, BX, CX, DX 这 几 个 常量 。 





这 里 要 注意 一 点 ， 比 如 RegisterClass .AX 这 个 常量 指 代 了 eax 寄存 器 、ax 寄存 器 和 al 
寄存 器 的 整体 。eax ax, al 实际 上 分 别 是 一 个 寄存 器 的 不 同 部 分 ， 生 成 代码 的 时 候 将 这 些 寄存 





器 作为 一 个 整体 表示 会 更 方便 些 。 
HIN, (R eax 寄存 器 、ax 寄存 器 和 al 寄存 器 一 样 ， 在 物理 上 从 属 


一 个 寄存 器 的 寄存 顺 集 





A 
H 


本 书 和 cbe 中 都 称 为 寄存 器 类 (register class), RegisterClass.AXÍlRegisterClass.BX 


这 样 的 常量 都 表示 寄存 器 类 。 





现在 回 到 DSL。ax、al、bx 这 3 个 方法 的 定义 如 代码 清单 15.5 所 示 。 


代码 清单 15.5 ”别名 方法 (sysdep/x86/CodeGenerator.java) 


private Register ax() { return ax(naturalType); } 
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private Register al() { return ax(Type.INT8); } 
private Register bx() ( return bx(naturalType); } 





接 下 来 使 用 上 文中 提 及 的 ax (6) 和 px (c) TAKER Register 实例 。naturalType 
是 CodeGenerator 类 的 字段 ， 它 保存 的 是 表示 各 个 CPU 的 原始 大 小 (natural size) HJ asm. 
Type。 所 谓 CPU 的 原始 大 小 指 的 是 ， 如 果 是 32 位 CPU 的 话 ， 一 个 整数 的 大 小 就 是 Type . 
INT32; 如 果 是 64 位 CPU 的 话 ， 一 个 整数 的 大 小 就 是 Type .INT64。 相 应 的 寄存 器 则 是 eax 
或 者 esi。 


表示 立即 数 和 内 存 引 用 


K 15.3 中 列举 了 CodeGenerator 类 中 定义 的 表示 立即 数 和 内 存 引 用 的 方法 。 这 些 方法 的 
返回 值 是 ImmediateValue 实例 (立即 数 ) 或 者 MemoryReference 实例 (内存 引用 )。 


表 15.3 ”表示 立即 数 和 内 存 引 用 的 DSL 









































































































































TIZA 含义 

imm(long num) 整数 num 的 值 ( $num 

imm(Symbol sym) 符号 sym 的 值 ( $sym ) 

mem(Symbol sym) 符号 sym 的 直接 地 址 引用 (sym ) 

mem(Register reg) 寄存 器 reg 的 间接 地 址 引用 ( Otreg) ) 

mem(long off, Register reg) 根据 偏 移 量 和 寄存 器 reg 返回 间接 地 址 引用 ( off(reg) ) 
mem(Symbol off, Register reg) 根据 偏 移 量 和 寄存 器 reg 返回 间接 地 址 引用 ( off(reg) ) 



























































下 面 是 这 几 个 方法 的 用 例 ， 右 侧 的 注释 里 是 对 应 的 汇编 代码 。 








imm(0) // $0 
mem (ax () ) // 0(%eax) 
mem(4, ax()) // 4(*5eax) 


表示 指令 
为 了 生成 表示 指令 的 对 象 ，Assemblycode 实例 中 定义 了 和 助 记 符 同名 的 方法 ， 其 中 的 部 
分 方法 如 表 15.4 所 示 。 


表 15.4 描述 指令 的 DSL 
方法 含义 
f 
f 
f 
f 

















mov(Register s, Register d) 





mov 指令 把 s 的 值 赋值 给 d 

mov 指令 把 reg 的 值 保 存 到 内 存 中 
mov 指令 把 内 存 中 的 值 加 载 到 reg 中 
push(Register reg) push 指令 将 reg 压 栈 

pop(Register reg) 使 用 pop 指令 使 reg 出 栈 
add(Operand val, Register reg) 使 用 add 指令 使 reg 的 值 加 上 val 














mov(Register reg, Operand mem) 














mov(Operand mem, Register reg) 
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方法 含义 

sub(Operand val, Register reg) 使 用 sub 指令 使 E reg 的 值 减 去 val 
imul(Operand val, Register reg) 使 用 imul 指令 使 reg KAR Y val 
call(Symbol sym) 使 用 call 指令 调用 函数 sym 

ret() 使 用 ret 指令 返回 原 处 理 流 程 
jmp(Label lab) 使 用 jmp 指令 无 条 件 跳 转 到 lab 






































这 些 方法 的 用 例如 下 所 示 。 右 侧 的 注释 对 应 的 是 这 些 方法 被 调用 时 相应 的 汇编 代码 。 


AssemblyCode as - new AssemblyCode(....); 


as.mov(mem(ax()), ax()); // movl (%eax), $eax 
as.push(ax()); // pushl $eax 
as.sub(imm(1), ax()); // subl $1, $*eax 


像 这 样 调用 这 些 方法 后 ， 会 生成 相应 的 Instruction 实例 ， 并 把 这 
例 添加 到 AssemblyCode 实例 内 部 的 列表 中 。 


FI 表示 汇编 伪 操 作 、 标 签 和 注释 


最 后 介绍 表示 汇编 伪 操 作 、 标 签 和 注释 的 方法 。 表 示 这 
类 中 声明 的 。 
表 15.5 中 列举 了 一 部 分 表示 汇编 伪 操 作 的 方法 。 
表 15.5 ”表示 汇编 伪 操 作 的 部 分 DSL 
方法 


x^^ Instruction X 











X 3 个 语法 的 方法 和 指令 一 样 ， 是 在 





TF 











AssemblyCode 














.file(String name) 


汇编 伪 操 作 .file 声明 文件 名 name 




















_globl(Symbol sym) 


汇编 伪 操 作 .globl 使 得 sym 成 为 全 局 变量 























汇编 伪 操 作 .section 切换 到 sect 代码 片段 





_section(String sect) 

















由 此 可 见 ， 表示 汇 编 伪 操作 的 方法 名 只 是 把 相应 的 汇编 伪 操 作 名 称 里 起 始 位 置 的 “.” 圭 换 
成 下 划 线 而 已 。 例 如 . file 汇编 伪 操 作对 应 _file 方法 ，. size 汇编 伪 操 作对 应 _size 方 
法 。cbc 的 CodeGenerator 的 源 代 码 里 ， 只 要 是 以 下 划 线 开头 的 方法 ， 都 是 生成 汇编 伪 操 作 
的 方法 。 

表示 标签 和 注释 的 方法 如 表 15.6 所 示 。 

表 15.6 表示 标签 和 注释 的 DSL 







































































方法 含义 

label(Symbol sym) 输出 定义 了 符号 sym 的 标签 

label(Label label) 输出 定义 了 和 标签 label 同样 符号 的 标签 
comment(String str) 输出 str 作为 注释 














生成 标签 使 用 的 是 AssemblyCode 类 中 的 label 方法 ， 而 生成 注释 使 用 的 是 comment 


方法 。 


15.3 cbc 的 x86 汇编 DSL 











各 个 方法 的 用 例如 下 所 示 ， 右 侧 的 注释 依然 是 相应 的 汇编 代码 。 


AssemblyCode as = new AssemblyCode(....); 


Evo sable (UlaredEdbo), el //| .file "hello.cb" 

as. section(".text"); // .section .text 

as. globl(new NamedSymbol ("main")); // .globl main 

as.label(new NamedSymbol ("main")); // main: 

as.comment("this is a comment."); // # this is a comment. 


这 里 只 是 简单 地 介绍 了 一 下 汇编 伪 操 作 ， 接 下 来 实际 用 到 的 时 候 会 再 详细 解说 。 
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d 





Cx 
t 5. » CodeGenerator 类 的 概要 





本 节 将 介绍 CodeGenerator 类 的 概要 。 


CodeGenerator 类 的 字段 








首先 ， 代 码 清单 15.6 中 展示 了 CodeGenerator 类 的 字段 声明 以 及 构造 函数 。 
代码 清单 15.6 CodeGenerator 类 的 构造 函数 


final CodeGeneratorOptions options; 
final Type naturalType; 
final ErrorHandler errorHandler; 





public CodeGenerator(CodeGeneratorOptions options, 


Type naturalType, ErrorHandler errorHandler) { 
this.options - options; 
this.naturalType - naturalType; 
this.errorHandler - errorHandler; 


) 


options 字段 中 保存 的 CodeGeneratorOptions 实例 集中 了 所 有 与 codeGenerator 
相关 的 选项 。 它 是 由 compiler 包 里 的 options 类 基于 命令 行 选项 得 到 的 。 
naturalType 字段 保存 的 是 所 要 生成 的 汇编 语言 的 整数 的 原始 大 小 。 这 里 所 需 的 值 为 





Type.INT32。cbc $ 
































只 支持 单 CPU， 因 此 实际 上 直接 在 程序 中 写 Type . INT32 也 是 没 问题 的 。 





不 过 这 么 写 太 过 分 散 ， 不 便于 后 续 修 改 ， 因 此 将 其 作为 CodeGenerator 构造 函数 的 一 个 参数 


传 进来 了 。 








BH, errorHandler 和 以 往 一 样 ， 这 个 字段 保存 的 是 处 理 错误 信息 的 ErrorHandler 





实例 。 


CodeGenerator 类 的 处 理 概述 





下 面 粗略 地 介绍 一 下 从 CodeGenerator 类 的 人 口 函 数 generate 方法 被 调用 开始 ， 到 开 
始 编译 各 个 函数 体 为 止 的 处 理 。 
之 所 以 “粗略 地 ”介绍 这 一 部 分 内 容 ， 是 因为 还 是 想 以 介绍 函数 体 的 编译 为 主 。 函 数 体 编 























译 开 始 之 前 的 代码 通常 都 只 是 用 来 分 配 全 局 变量 或 者 局 部 变量 的 内 存 地 址 等 ， 而 事先 读 懂 使 用 
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了 这 些 变量 的 代码 有 助 于 理解 这 些 处 理 背 后 的 意义 。 男 外 ， 如 果 不 先 搞 清楚 函数 体 被 编译 成 了 
怎么 样 的 代码 ， 也 就 无 从 理解 函数 序言 和 尾声 代码 的 意图 。 因 此 ， 对 于 从 generate 函数 调用 
到 函数 体 被 编译 之 前 的 代码 ， 我 们 仅 限 于 了 解 其 概要 ， 在 此 之 前 要 先 详细 说 明 函 数 体 的 编译 过 
程 ， 而 这 部 分 被 粗略 跳 过 的 内 容 将 会 在 第 16 章 详细 讲解 。 

那么 ， 下 面 简要 地 介绍 generate 方法 。 代 码 清单 15.7 所 示 为 generate 类 往 下 的 静态 
调用 图 。 
代码 清单 15.7. CodeGenerator 类 的 静态 调用 图 


generate 
locateSymbols 
locateStringLiteral 
locateGlobalVariable 
locateFunction 


















































compileIR 

compileGlobalVariable 

compileStringLiteral 

compileFunction 

compileFunctionBody 

compileStmts 
generateFunctionBody 

compileCommonSymbol 

PICThunk 


静态 调用 图 (static call graph ) 就 是 把 方法 的 调用 关系 图 形 化 。 在 代码 清单 15.7 中 ， 缩 进 就 表 
示 代 码 中 的 调用 。 也 就 是 说 ，generate 方法 调用 了 locateSymbols 方法 和 compileIR 方法 ， 
locateSymbols 方法 调用 了 locateStringLiteral 方法 locateGlobalVariable 方法 和 
locateFunction 方法 …… 

generate 方法 首先 调用 locateSymbols 方法 , 确认 所 有 字符 串 字 面 量 和 全 局 变量 的 地 
址 。 接 着 调用 compileIR 方法 ， 进 而 正式 进入 编译 流程 。 

compileIR 方 法 调用 形 如 compile x x x x 的 方法 ， 开 始 编译 全 局 变量 和 函数 。 其 中 ， 
compileFunction 是 编译 阵 数 的 方法 。 

compileFunction 方 法 在 确认 了 局 部 变量 的 地 址 后 ， 调 用 conpileFunctionBody 77 
法 开始 编译 函数 体 。compileFunctionBody 方法 再 调用 compileStmts 方法 ,在 函数 体 被 
ER. ， 解 释 其 编译 结果 ， 生 成 相应 的 序言 和 尾声 代码 。 









































NS 



































实现 compileStmts 方法 


compileStmts 方法 的 代码 如 代码 清单 15.8 所 示 。 
代码 清单 15.8 compileStmts 方法 ( sysdep/x86/CodeGenerator.java ) 





private AssemblyCode as; 
private Label epilogue; 
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private AssemblyCode compileStmts (DefinedFunction func) { 
as = newAssemblyCode(); 
epilogue - new Label(); 
for (Stmt s : func.ir()) ( 
compileStmt (s); 


} 
as.label (epilogue); 
return as; 
} 
compileStmts 方法 先 初始 化 as 字段 和 epilogue 字段 ， 接 着 把 表示 函数 体 的 中 间 代 码 
func.ir() 按 顺 序 编 译 。func.ir() 返回 的 中 间 代 码 就 是 IRGenerator 生成 的 Stmts 列 
表 。 其 中 不 包含 序言 和 尾声 代码 。 
接着 ， 在 foreach 循环 中 调用 的 compilestmt 方法 如 下 所 示 。 
代码 清单 15.9 compileStmt 方法 ( sysdep/x86/CodeGenerator.java ) 














private void compileStmt(Stmt stmt) { 
if (options.isVerboseAsm()) { 
if (stmt.location() != null) ( 
asg.comment (stmt.location().numberedLine()); 
) 
) 


stmt.accept (this); 
) 
最 先 的 if 语句 是 处 理 - -vezbose-asm 选 项 相关 的 代码 ， 除 此 以 外 的 代码 都 只 是 对 中 间 
代码 的 遍历 处 理 。 之 后 只 需 把 每 个 节点 编译 成 汇编 代码 即 可 。 


cbc 的 编译 策略 


在 本 市 的 最 后 ， 我 们 来 了 解 一 下 cbe 内 部 生成 汇编 代码 的 策略 。cbc 在 编译 生成 汇编 代码 的 
时 候 遵 循 如 下 3 个 规则 。 

1. Cb 中 所 有 变量 或 者 临时 变量 都 保存 到 内 存 中 

2. 对 内 存 的 操作 限定 为 mov 指令 

3. 限定 每 个 寄存 器 类 的 应 用 范 贰 

第 1 点 是 说 ，Cb 的 局 部 变量 、 生 成 中 间 代 码 时 引入 的 临时 变量 全 都 要 不 假 思 索 地 存 进 内 
存 。 深 度 优化 的 编译 器 通常 都 会 把 临时 变量 存 进 寄 存 器 以 获得 高 效率 的 代码 ， 而 cbe 中 不 进行 
任何 这 方面 的 性 能 优化 。 

第 2 点 是 说 ， 对 内 存 的 操作 只 能 用 mov 指令 。 比 方 说 ada 指令 可 以 直接 对 内 存 上 的 值 作 加 
法 运算 ， 但 cbe 中 不 允许 这 样 的 用 法 。 要 对 内 存 中 的 值 进行 运算 时 ， 一定 要 先 执 行 mov 指令 把 
这 个 值 加 载 到 寄存 器 中 ， 运 算 完 成 后 再 执行 mov 指令 把 值 存 进 内 存 中 。 











































































































15.4 CodeGenerator 类 的 概要 293 





虽然 表面 上 看 上 去 1 个 指令 变 成 了 3 个 指令 ， 执 行 速度 似乎 变 慢 了 ， 但 实际 上 这 两 种 用 法 
的 执行 速度 是 一 致 的 。 在 现代 的 x86 CPU 中 ， 比 如 对 内 存 中 的 值 进行 加 法 运算 时 ，CPU 内 部 也 
是 分 解 成 上 述 基 于 mov 的 几 个 步 又 来 处 理 的 。 也 就 是 说 ， 无 论 最 终 写 成 1 个 指令 的 形式 还 是 3 
个 指令 的 形式 ， 最 终 CPU 内 部 的 处 理 都 是 一 致 的 。 

第 3 点 指 的 是 ， 每 个 寄存 器 都 有 自己 的 功能 ， 不 能 用 作 其 他 用 途 。 具 体 而 言 ， 每 个 寄存 右 
承担 的 职责 如 表 15.7 所 示 。 
表 15.7 cbc 中 各 个 寄存 器 的 职责 




































































方法 含义 

ax 累加 器 

bx GOT 的 地 址 ( 详 见 第 21 章 ) 

cx 临时 存储 

dx div 指令 和 idiv 指令 专用 的 临时 存储 
sp 栈 指针 

bp 栈 帧 指针 

si 未 使 用 

di 未 使 用 























其 中 ， 累 加 器 (accumulator ) 指 的 是 用 于 保存 计算 结果 的 寄存 器 。 把 ax 寄存 器 用 作 累 加 器 
是 指 ， 例 如 把 var 节点 编译 后 得 到 的 变量 值 存 进 ax 寄存 器 ， 把 Bin 节点 进行 加 法 运算 等 计算 
的 结果 保存 到 ax 寄存 器 中 。 

Ay. HAE ax 寄存 器 无 法 完成 运算 时 ， 就 会 用 cx 寄存 器 作为 辅助 。 璧 如 Bin 节点 的 运 
算 中 需要 2 个 寄存 器 ， 这 时 会 把 左边 式 子 的 值 存 进 ax 寄存 器 ， 右 边 式 子 的 值 存 进 cx 寄存 器 。 

这 个 规定 使 得 大 部 分 的 运算 都 集中 到 了 ax 寄存 器 和 cx 寄存 器 上 。 有 时 候 存在 临时 寄存 需 
数量 不 足 的 问题 ， 这 时 可 以 通过 压 栈 的 方式 把 ax 寄存 器 和 cx 寄存 器 空 出 来 。 另 外 ， 也 会 遇 到 
编译 其 他 节点 时 ax 寄存 器 和 cx 寄存 器 被 覆盖 的 问题 ， 这 时 也 应 该 通过 压 栈 保存 其 中 的 值 。 

还 要 注意 一 点 ， 由 于 cx 是 caller-save 寄存 器 ， 因 此 要 注意 在 cx 赋值 后 ， 一 直到 使 用 这 个 
值 之 前 ， 都 不 应 该 调用 其 他 函数 。 
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[- 编译 Int 节点 
下 面 按 顺序 介绍 各 个 节点 的 代码 。 首 先 看 代码 最 简单 的 Int 节点 。Int 节点 就 是 表示 整数 
常量 的 节点 ， 它 会 生成 类 似 下 面 的 汇编 代码 。 
movil $1, $eax # 把 工 传 入 ax 寄存 器 


转换 Int 节点 的 代码 如 代码 清单 15.10 所 示 。 
代码 清单 15.10 ”编译 Int 节点 ( sysdep/x86/CodeGenerator.java ) 








public Void visit(Int node) { 
as.mov(imm(node.value()), ax()); 
return null; 


) 


Jh, node.value () 返回 的 是 这 个 Int 节点 的 整数 常量 的 值 ， 利 用 imm 方法 将 其 转换 
成 汇编 对 象 后 ， 调 用 mov 方法 生成 传人 ax 寄存 器 的 代码 ， 这 样 就 可 以 把 整数 传人 ax 寄存 器 。 
这 段 代码 简洁 明了 ， 应 该 可 以 轻松 读 懂 。 


编译 Str 节点 


接 下 来 看 看 同样 表示 常量 的 Scc IARI. str Bc TEN EB. HET E E 
必须 编译 其 起 始 内 存 地 址 ， 对 应 的 汇编 代码 如 下 。 











2n Or 
.String "Hello, World! Wn" 





movil $S.LCO, $eax 
首先 ， 预 先 用 .string 汇编 伪 操 作 把 字符 串 常量 输出 到 汇编 文件 中 ， 定 义 相 应 的 标签 ( 这 
里 是 .LC0 )。 之 后 在 函数 的 代码 中 就 可 以 通过 标签 .DC0 来 访问 这 个 地 址 了 。 
这 里 要 特别 注意 不 要 误 写 成 下 面 这 名 代码 。 























movil .LCO, $eax 
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看 到 这 里 的 区 别 了 吗 ? 没 错 ，$ 被 去 掉 了 。 如 果 像 这 样 没有 加 上 的 话 ， 就 是 直接 内 存 引 
FH, 这样 mov 指令 就 不 是 加 载 字符 串 的 起 始 地 址 ， 而 是 加 载 这 个 地 址 指向 的 4 个 字 节 了 。 加 上 
$， 用 汇编 对 象 来 解释 就 是 生成 ImmediateValue 对 象 ， 而 不 是 DirectMemoryReference 
对 象 。 

把 str 市 点 编译 成 汇编 代码 的 代码 如 代码 清单 15.11 所 示 。 
代码 清单 15.11 编译 Str 节点 ( sysdep/x86/CodeGenerator.java ) 
































public Void visit(Str node) { 
loadConstant (node, ax()); 
return null; 


) 

















可 以 看 到 ，Stz 节点 的 转换 是 直接 交 由 loadConstant 方法 来 进行 的 。loadConstant 
方法 会 生成 把 str 市 点 或 者 Int 节点 的 值 加 载 到 第 2 个 参数 的 寄存 器 中 的 代码 。 注 意 这 里 也 是 
把 值 传人 ax 寄存 器 。 由 于 ax 寄存 器 是 累加 器 ， 因 此 常常 把 节点 的 值 保存 到 ax 寄存 器 中 。 

loadConstant 方法 的 代码 如 代码 清单 15.12 所 示 。 
代码 清单 15.12 loadConstant 方法 ( sysdep/x86/CodeGenerator.java ) 





private void loadConstant(Expr node, Register reg) { 
if (node.asmValue() !- null) { 
as.mov(node.asmValue(), reg); 


) 


else if (node.memref() != null) { 
as.lea(node.memref(), reg); 


else ( 
throw new Error("must not happen: constant has no asm value"); 


} 
} 


虽然 代码 中 按照 不 同 的 情况 分 成 了 不 同 的 处 理 流程 ， 但 最 常用 的 是 第 1 种 情况 。 第 2 种 情 
况 中 的 处 理 流程 只 在 生成 地 址 无 关 代 码 (第 21 E) 的 时 候 会 用 到 。 

第 1 种 情况 中 ， 用 mov 指令 把 node.asmValue() 传人 reg 寄存器。Str 节点 的 
asmValue 方法 把 该 节点 对 应 的 字符 串 和 常量 的 地 址 以 ImmediateValue 对 象 的 形式 返回 。 这 
时 的 地 址 ， 也 就 是 .LCo0 之 类 的 标记 ， 是 在 CodeGenerator 最 开始 的 处 理 中 就 统一 分 配 好 
的 。 分 配 内 存 地 址 的 代码 会 在 第 21 章 中 统一 介绍 。 


FJ 编译 Uni 节点 (1) 按 位 取 反 
接 下 来 看 看 表示 一 元 运算 表达 式 的 Uni 节点 。 编 译 Uni 节点 的 代码 如 代码 清单 15.13 所 示 。 
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代码 清单 15.13 ”编译 Uni 节点 ( sysdep/x86/CodeGenerator.java ) 


public Void visit (Uni node) { 
Type src = node.expr().type(); 
Type dest - node.type(); 





compile (node.expr()); 

switch (node.op()) ( 

case UMINUS: 
as.neg(ax(src)); 
break; 

case BIT NOT: 
as.not(ax(src)); 
break; 

case NOT: 





as.test(ax(src), ax(src)); 
as.sete(al()); 
as.movzx(al(), ax(dest)); 
break; 
case S CAST: 
as.movsx(ax(src), ax(dest)); 
break; 
case U CAST: 
as.movzx(ax(src), ax(dest)); 
break; 
default: 
throw new Error("unknown unary operator: " + node.op()); 





) 


return null; 


) 


在 这 个 方法 中 ， 大 部 分 都 是 根据 运算 符 的 不 同 而 进行 不 同 处 理 的 switch 语句。 首先 我 们 
试 着 只 考虑 BIT_NOT 的 情况 ( ~x、 按 位 取 反 )。 这 样 的 话 ， 事实 上 就 只 有 下 面 这 3 行 代码 了 。 














Type src = node.expr().type(); 
compile (node.expr()); 
as.not (ax(src)); 





首先 调用 compile 方法 编译 node .expr () ， 也 就 是 编译 ~x 中 x 的 部 分 。compile 方 
法 和 node.accept (this) 一 样 ， 都 可 以 编译 任意 Expr 节点 。 

编译 后 的 表达 式 的 值 保存 到 了 ax 寄存 器 中 ， 因 此 下 一 步 就 是 对 ax 寄存 器 执行 not 指令 进 
行 按 位 取 反 。 这 个 时 候 ， 因 为 需要 根据 数据 类 型 选择 不 同 大 小 的 寄存 器 ， 因 此 用 ax (6) 方法 根 
Ji node.expr() 的 类 型 选择 寄存 器 。 不 过 因为 C 语 言 (Cb) 中 有 整 型 提升 的 规定 ， 所 以 事实 
上 这 里 只 会 返回 32 位 整数 的 操作 指令 。 

最 后 ，not 指令 执行 结束 后 的 值 会 写 人 操作 数 寄存 器 ， 这 样 Uni 节点 的 值 也 就 自动 保留 到 
ax AITA To 

总 的 来 说 ，BIT_NOT 运算 的 Uni 节点 会 被 编译 成 如 下 代码 。 



































15.5 “编译 单纯 的 表达 式 “| 297 








eee 编译 node . expr () 后 得 到 的 代码 …… 
notl $eax 


编译 Uni 节点 (2) 逻辑 非 


其 他 运算 符 都 不 会 出 现 和 字面 意思 完全 不 一 致 的 情况 ， 只 有 NOT Ox, BHAE) 没 法 做 到 
让 人 人 一目了然 ， 所 以 这 里 对 它 稍 作 说 明 。 把 处 理 NOT 的 代码 单独 抽出 来 ， 如 下 所 示 。 








as.test(ax(src), ax(src)); 
as.sete(al()); 
as.movzx(al(), ax(dest)); 


首先 用 test 指令 得 到 各 ax 寄存 器 的 按 位 逻辑 与 (x&y )。 这 样 处 理 后 ， 只 有 当 1x 中 的 x 
为 0 时 ， 也 就 是 ax 寄存 需 的 值 为 0 时 ， 其 结果 才 是 0。 

test 指令 的 结果 为 0 时 ， 标 志 寄 存 器 ZF 为 1， 这 时 用 sete 指令 把 这 个 值 取出 来 ， 把 al 
寄存 带 设 置 为 1。 其 他 情况 下 都 为 0。 

最 后 调用 movzx 指令 把 al 寄存 器 的 值 进行 零 扩 展 后 传人 ax 寄存 带 。 换 句 话说 ， 就 是 把 ax 
寄存 融 除 最 后 8 位 以 外 全 部 清 零 。sete 指令 只 会 操作 ax 寄存 融 的 最 后 8 位 ， 因 此 ax 寄存 需 第 
9 位 以 上 和 指令 执行 前 一 致 。 所 以 需要 最 后 执行 movzx 指令 。 

以 上 3 个 指令 的 结果 就 是 : 如 果 ax 之 前 的 值 为 0， 则 新 值 为 1， 其 余 情况 下 新 值 全 部 为 0。 
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本 节 来 讲解 表示 二 元 运算 的 Bin 节点 的 编译 。 


[F3 58i Bin 节点 

为 了 优化 性 能 ， 编 译 Bin 节点 的 方法 分 了 各 种 不 同 的 情况 进行 处 理 ， 本 书 中 只 取 其 中 最 为 
通用 的 情况 进行 解说 。 
代码 清单 15.14 ”编译 Bin 节点 ( sysdep/x86/CodeGenerator.java ) 




















public Void visit(Bin node) { 
Op op = node.op(); 
Type t - node.type( 
compile (node.right( 
as.virtualPush (ax() 
compile (node.left() 
as.virtualPop(cx()) 
compileBinaryOp(op, ax(t), cx(t)); 
return null; 


; 


) 


f 
; 


) 
) 
) 
); 


i 


) 


首先 调用 compile 方法 编译 右边 的 表达 式 node.right () ， 之 后 右边 的 表达 式 的 值 会 保 
存 到 ax 寄存 器 中 。 

接着 调用 as .viztualPush 方法 把 ax 寄存 器 的 值 压 入 栈 顶 。 现 在 先 把 virtualPush 方法 
和 virtualPop 方法 等 同 为 push fll pop. XF virtualPush 的 内 容 会 在 第 16 章 详细 说 明 。 

这 时 候 ax 寄存 咒 的 值 已 经 保存 到 了 栈 中 ， 不 用 担心 右边 的 表达 式 的 值 会 丢失 了 ， 所 以 可 以 
接着 调用 compile 方法 ,编译 左边 的 表达 式 node .left () ， 并 将 得 到 的 结果 继续 保存 到 ax 
寄存 顺 中 。 

接着 使 用 as .viztualPop 方 法 ， 把 栈 顶 的 值 取 出 到 cx 寄存 器 中 。 这 个 栈 顶 的 值 就 是 刚 
刚 压 栈 的 右边 表达 式 的 值 。 

经 过 上 述 步 又 后 ， 右 边 表 达 式 的 值 就 保存 到 了 cx 寄存 器 ， 而 左边 表达 式 的 值 则 保存 到 了 
ax 寄存 器 中 。 最 后 调用 compileBinaryOp 方法 ， 生 成 ax 和 cx 间 的 运算 指令 。 如 果 node. 
op () JJ Op.ADD, compileBinaryOp 方法 就 会 生成 ada 指令 。 

假设 node .op O0 为 op.ADD， 那 么 最 终 这 个 方法 生成 的 汇编 代码 如 下 。 
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15.6 ”编译 二 元 运算 




















ogg 右边 表达 式 编 译 后 的 汇编 代码 …… 

push $eax # 将 右边 表达 式 的 值 压 栈 
5 左边 表达 式 编译 后 的 汇编 代码 …… 

pop $ecx # 使 右边 表达 式 的 值 出 栈 
addl Secx, $eax TED 


最 后 的 ada 指令 把 cx 寄存 顺 的 值 (右边 表达 的 值 ) 和 ax 寄存 需 的 值 ( 左边 表达 式 的 值 ) 
相 加 ， 并 将 结果 保存 到 ax 寄存 器 中 。 最 终 计算 结果 被 正确 地 保存 到 了 ax 寄存 器 中 。 

这 里 要 注意 的 是 ，C 语言 的 编译 需 通 常 从 式 子 的 右 侧 开始 编译 ，cbc 中 也 同样 从 右边 开始 编 
译 ， 不 过 从 左边 开始 计算 结果 也 一 样 。 因 为 cbe 的 中 间 代 码 的 Expr 节点 没有 副作用 。 表 达 式 
中 并 不 存在 函数 调用 、 变 量 代 入 等 ， 所 以 无 论 从 左边 还 是 右边 开始 计算 结果 都 一 样 。 





























实现 compileBinaryOp 方法 


compileBinaryop 方法 如 代码 清单 15.5 所 示 。 
代码 清单 15.15  compileBinaryOp 方法 的 开头 ( sysdep/x86/CodeGenerator.java ) 





private void compileBinaryOp(Op op, Register left, Operand right) { 
switch (op) { 
case ADD: 
as.add(right, left); 
break; 
case SUB: 
as.sub(right, left); 
break; 


€— 以 下 省 上 略 …… 

像 这 样 ， 根 据 二 元 运算 符 op 的 值 ， 对 不 同 的 运算 符 生成 相应 的 指令 。 

当 二 元 运算 符 的 值 为 Op .ADD、Op .BIT AND 或 者 op .BIT XOR 等 的 时 候 ，compileBinaryOp 
方法 的 实现 都 非常 简单 。 因 为 有 和 运算 一 一 对 应 的 汇编 语言 的 助 记 符 ， 所 以 只 需要 使 用 这 样 的 
助 记 符 进行 操作 数 之 间 的 运算 就 可 以 了 。 表 15.8 中 总 结 了 各 种 运算 符 和 对 应 的 指令 。 

表 15.8 二 元 运算 符 对 应 的 指令 
























































二 元 运算 符 指令 
ADD add 
SUB sub 
MUL imul 
BIT_AND and 
BIT_OR or 
BIT_XOR xor 
BIT LSHIFT sal 
BIT RSHIFT shr 
ARITH. RSHIFT sar 
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实现 除法 和 余数 


没有 一 一 对 应 的 指令 的 运算 是 比较 麻烦 的 。 这 样 的 运算 符 包括 有 符号 和 无 符号 的 除法 和 余 
数 ， 以 及 “==” 等 比较 运算 符 。 

首先 讲解 除法 和 余数 。 如 第 13 章 中 所 述 ， 实 现 除法 和 余数 之 前 ， 需 要 对 dx 寄存 器 进行 零 
扩展 或 者 符号 扩展 。 零 扩展 使 用 mov 指令 ,符号 扩展 使 用 clta 指令 。 

另外 ， 执 行 除法 运算 后 ， 作 为 副作用 ，dx 寄存 器 中 会 保留 余数 。 因 此 计算 余数 (s MOD. 
D MOD) 的 时 候 ， 最 后 要 把 dx 寄存 器 的 值 传 人 ax 寄存 器 。 

结合 上 述 这 些 信息 ， 我 们 来 看 看 compileBinaryop 方法 内 编译 有 符号 除法 (s DIV) 和 
有 符号 余数 运算 (s Mop) 的 代码 (代码 清单 15.16 )。 
代码 清单 15.16 compileBinaryOp 方法 ( sysdep/x86/CodeGenerator.java ) 




















case S DIV: 
case S MOD: 
as.cltd(); 
as.idiv(cx(left.type)); 
if (op == Op.S MOD) { 
as.mov(dx(), left); 
} 


首先 调用 cita 指令 ， 对 dx 寄存 需 进 行 符 号 扩展 ， 接 着 执行 idiv 指令 ， 进 行 cx 寄存 名 
和 ax 寄存 器 之 间 的 除法 运算 。 运 算 符 是 余数 (S MOD) 的 时 候 ， 还 要 加 上 mov 指令 把 dx 寄存 
器 的 值 传人 ax 寄存 器 中 。 


Py 实现 比较 运算 
最 后 看 看 == 之 类 的 比较 运算 符 的 编译 过 程 。 先 说 结论 ,“==”( Bo ) 会 被 编译 成 如 下 代码 。 














cmpl %ecx, %eax 
sete %al 
movzbl šal, $eax 


首先 调用 cmp 指令 比较 左右 表达 式 的 值 。 这 时 ， 如 果 左 右 表达 式 的 值 相等 ，ZF 标志 将 变 
为 1。 接着 调用 sete 指令 把 ZF 标志 的 值 取 出 到 al 寄存 器 中 。 最 后 调用 movzx 指令 (movzbl 
§ 今 ) 把 al 寄存 器 的 值 进行 零 扩 展 ， 并 传人 eax 寄存 器 。 需 要 执行 movzx 指令 的 理由 和 之 前 讲 
MZE CNOT ) 时 提 到 的 一 样 。 
遵循 上 述 逻 辑 ，compileBinaryop 的 EQ 部 分 的 代码 如 下 。 














as.cmp(right, ax(left.type)); 
as sete NE 
as.movzx(al(), left); 


Uh, right 就 是 cx Arit, left 就 是 ax 寄存 器 。 这 段 代 码 看 起 来 几乎 和 汇编 
是 比较 容易 理解 的 。 


一 





Vd 

















# 
Bio 
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引用 变量 和 赋值 








本 节 将 讲解 引用 变量 和 赋值 的 编译 过 程 。 


F3 编译 Var 节点 
先 来 讲解 引用 变量 的 Var 节点 的 编译 过 程 。 首 先 ，vVar 节点 对 应 的 汇编 代码 如 下 所 示 。 





movil 4(S$ebp), $eax 
编译 Var BI AM 15.7 所 示 

















代码 清单 15.17 编译 Var 节点 ( sysdep/x86/CodeGenerator.java ) 


public Void visit (Var node) { 
loadVariable (node, ax()); 
return null; 


) 





整个 处 理 几 乎 全 部 交 由 loadVariable 方法 进行 。1oadVariable 方法 的 第 1 个 参数 是 
需要 加 载 的 var 节点 ， 第 2 个 参数 是 加 载 的 目的 地 址 。 
再 来 看 看 1oadqVariable 方法 。 
代码 清单 15.18 loadVariable 方法 ( sysdep/x86/CodeGenerator.java ) 


























private void loadVariable(Var var, Register dest) ( 


if (var.memref() == null) { 
Register a - dest.forType (naturalType); 
as.mov(var.address(), a); 





load (mem (a), dest.forType(var.type())); 


) 


else ( 
load(var.memref(), dest.forType(var.type())); 
} 
} 
最 开始 的 条 件 var .memref () == null 只 在 生成 地 址 无 关 代码 (第 21 章 ) 的 时 候 ， 在 特 
定 的 全 局 变量 的 情况 下 才 成 立 。 因 此 ， 现 在 先 忽略 其 后 面 的 then 部 分 。 
else MAMAH T load 方法 。1oad 方法 的 第 1 个 参数 是 变量 加 载 源 的 内 存 引 用 ,第 2 个 
参数 是 加 载 日 标的 寄存 器 。 
传 信 1oad 方 法 的 第 1 个 参数 var .memref () 正 是 引用 变量 的 内 存 引 用 对 象 。 比 方 说 
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局 部 变量 用 bp 寄存 器 保 在 ， 因 此 这 时 候 返 回 的 是 像 4(sebp) 这 样 的 间接 内 存 引 用 。var. 
memref () 方法 在 这 种 情况 下 返回 的 是 对 应 的 IndirectMemoryReference 对 象 。 

另外 ,第 2 个 参数 的 aest . e (var.type 0) 是 处 理 类 型 大 小 的 Register 对 象 。 
比如 ax () .forType (Type. INT8) 会 返回 al AFX Register 对 象 。 

这 里 附 上 load 方法 的 代码 。 
代码 清单 15.19 load 方法 ( sysdep/x86/CodeGenerator.java ) 


























private void load (MemoryReference mem, Register reg) { 
as.mov (mem, reg); 
} 
load 方法 仅仅 封装 了 mov 方法 。 这 个 方法 的 定义 是 为 了 指明 从 内 存 中 加 载 mov 指令 时 使 用 。 


汇总 起 来 ， 上 述 步 又 相当 于 执行 了 如 下 代码 。 





as.mov(var.memref(), ax(var.type())); 


也 就 是 说 ， 从 变量 对 应 的 内 存 var .memref () 中 ， 把 值 加 载 到 ax 寄存 器 。 另 外 ， 加 载 的 
数据 的 大 小 和 变量 一 致 。 


编译 Addr 节点 











接 下 来 看 看 表示 变量 地 址 的 Addr 节点 的 编译 过 程 。Var 节点 是 加 载 变量 内 容 的 节点 ， 与 
之 相对 ，RAdaz 节点 是 设置 变量 的 地 址 的 方 点 。 因 此 ， 如 果 是 局 部 变量 的 Addr 节点 ， 那 么 就 需 
要 生成 类 似 下 面 这 样 的 汇编 代码 。 





leal 4(%ebp), $eax 


接着 来 看 源 代码 。 编 译 addr 节点 的 代码 如 代码 清单 15.20 所 示 。 
代码 清单 15.20 ”编译 Addr 节点 ( sysdep/x86/CodeGenerator.java ) 





public Void visit(Addr node) { 
loadAddress (node.entity(), ax()); 
return null; 


} 
又 是 几乎 完全 交 由 其 他 方法 处 理 。1oadAddress 的 第 1 个 参数 是 需要 获取 地 址 的 变量 ， 
第 2 个 参数 则 是 接收 内 存 地 址 的 寄存 器 。 
loadAddress 方法 的 代码 如 代码 清单 15.21 所 示 。 
代码 清单 15.21 loadAddress 方法 ( sysdep/x86/CodeGenerator.java ) 








private void loadAddress(Entity var, Register dest) { 
if (var.address() !- null) { 
as.mov(var.address(), dest); 
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} 
else { 
as.lea(var.memref(), dest); 


} 
} 





HJE, var.address () 是 返回 变量 地 址 的 方法 。var .address () JË null 的 时 候 ， 直 
Bex n (E A p ESI SE ES BI n] 

M var.address() 为 null 的 时 候 ， 调 用 Lea 指令 把 var .memref () 得 到 的 地 址 设置 
到 寄存 需 中 。vatr .memref () 就 是 变量 对 应 的 MemoryReference () 对 象 。 

比方 说 ， 当 变量 为 局 部 变量 时 ，var .address () 就 是 null, var.memref () 则 是 


4 (&ebp) 这 样 的 与 内 存 引用 对 应 的 对 象 。 利 用 lea 指令 可 以 把 这 个 内 存 地 址 设置 到 寄存 器 中 。 


编译 Mem 节点 


接 下 来 介绍 解 引 用 指针 对 应 的 Mem 节点 的 编译 过 程 。 编 译 Mem 节点 的 代码 如 代码 清单 
15.22 所 示 。 
代码 清单 15.22 ”编译 Mem 节点 ( sysdep/x86/CodeGenerator.java ) 



























































public Void visit (Mem node) { 
compile (node.expr()); 
load(mem(ax()), ax(node.type())); 
return null; 


) 








首先 调用 compile 方法 编译 相当 于 *x 中 的 x 的 表达 式 。 编 译 后 的 汇编 代码 把 x 的 值 存 进 
ax 寄存 带 中 。 

接着 调用 loaa DA, JE ax 寄存 带 指 向 的 内 存 地 址 mem (ax () ) 的 值 加 载 到 ax 寄存 关中 。 
这 时 加 载 的 值 的 大 小 为 node . type O o 


这 个 过 程 并 不 复杂 。 


编译 Assign 节点 


在 本 节 的 最 后 ， 我 们 来 了 解 一 下 赋值 对 应 的 Assign 节 点 。 编 译 Assign 节点 的 代码 如 代 
码 清 单 15.23 所 示 。 


代码 清单 15.23 ”编译 Assign 节点 ( sysdep/x86/CodeGenerator.java ) 









































public Void visit(Assign node) { 
if (node.lhs().isAddr() && node.lhs().memref() !- null) { 
compile (node.rhs()); 
store(ax(node.lhs().type()), node.1hs().memref()); 
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) 


else if (node.rhs().isConstant()) ( 
compile (node.1hs()); 


as.mov(ax(), cx()); 
loadConstant (node.rhs(), ax()); 
store(ax(node.lhs().type()), mem(cx())); 
} 
else { 


compile (node.rhs()); 
as.virtualPush(ax()); 
compile (node.1hs()); 

as.mov(ax(), cx()); 

as. esit ie 
store(ax(node.lhs().type()), mem(cx())); 


) 


return null; 


) 


整个 方法 是 一 个 很 长 的 i£ 语句 ， 分 成 3 种 情况 处 理 。 不 过 ， 这 和 Bin 节点 时 的 情况 一 样 ， 是 
出 于 优化 代码 的 目的 而 进行 的 划分 。 最 后 一 种 情况 是 最 通用 的 ， Ap Li MUR a F-E, 

首先 ， 调 用 compile 方法 编译 变量 代入 右边 的 node .rhs () 。 调 用 virtualPush 方法 
把 ax 寄存 器 的 值 〈 右边 表达 式 的 值 ) 压 栈 保存 。 

然后 再 次 调用 compile 方法 编译 代入 左边 的 node .lhs () 。 这 时 左边 的 值 应 该 已 经 存 人 
了 ax 寄存 器 中 ， 于 是 调用 mov 指令 把 这 个 值 传人 cx 寄存 需 。 

接着 调用 virtualPop 方法 把 刚刚 保存 好 的 右边 的 值 恢复 到 ax 寄存 天 中 。 

最 后 调用 store 方法 把 ax 寄存 器 的 值 (右边 的 值 ) SA ex 寄存 器 〈 左 边 的 值 ) 指向 的 内 
存 。 其 中 store 方法 如 下 所 示 ， 只 是 单纯 封装 了 mov 方法 。 
代码 清单 15.24 store 方法 ( sysdep/x86/CodeGenerator.java ) 


























private void store(Register reg, MemoryReference mem) { 
as.mov (reg, mem); 


} 


这 样 Assign 节点 就 编译 完成 了 。 如 果 有 兴趣 ， 可 以 读 一 下 优化 代码 的 那 部 分 内 容 。 如 果 
掌握 了 目前 所 学 的 知识 ， 应 该 可 以 读 懂 的 。 
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本 节 将 介绍 jump iJ. PRG], return 语句 的 编译 过 程 。 





FH 


编译 LabelStmt 节点 





先 来 看 看 LabelSstmt 节点 的 编译 过 程 。 
代码 清单 15.25 ”编译 LabelStmt 节点 ( sysdep/x86/CodeGenerator.java ) 


public Void visit(LabelStmt node) { 
as.label(node.label()); 
return null; 


) 





仅仅 是 调用 AssemblyCode 类 的 label KGE XEM, MARAME. 


编译 Jump 节点 





下 面 来 看 Jump 节点 的 编译 过 程 。 
代码 清单 15.26 ”编译 Jump 节点 ( sysdep/x86/CodeGenerator.java ) 


public Void visit (Jump node) { 
as.jmp(node.label()); 
return null; 


) 


这 也 是 一 个 简单 的 处 理 。 就 是 执行 jmp 指令 ， 生 成 跳 转 到 目标 标签 的 jmp 指令 而 已 。 





编译 CJump 节点 








接 下 来 看 看 编译 与 有 条 件 跳 转 对 应 的 cJump 节点 的 代码 。 这 一 次 的 代码 就 有 相当 大 的 难度 了 。 


代码 清单 15.27 编译 CJump 节点 ( sysdep/x86/CodeGenerator.java ) 


public Void visit(CJump node) { 
compile (node.cond()); 
Type t - node.cond().type(); 
as.test(ax(t), ax(t)); 
as.jnz(node.thenLabel()); 
as.jmp(node.elseLabel()); 
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return null; 


) 


首先 调用 compile 方法 编译 条 件 表达 式 node .cond () 。 这 样 条 件 表 达 式 的 值 应 该 存 进 了 
ax 寄存 咒 ， 所 以 调用 test 指令 比较 ax 寄存 带 的 值 和 其 本 司 。 如 果 ax 寄存 器 的 值 非 0， 也 就 
是 条 件 表达 式 的 值 非 0 (= 真 )， 则 标志 寄存 器 ZF 变 为 1， 接 下 来 的 jnz 指令 被 执行 ， 最 终 跳 
FESI] node .thenLabel () 。 

如 果 ax 寄存 器 的 值 为 0， 也 就 是 说 条 件 表达 式 的 值 为 0(= 假 ) 那么 标志 寄存 器 ZF 的 值 
变 为 0， 因 此 接 下 来 的 jnz 指令 不 会 被 执行 ， 其 下 方 的 无 条 件 跳 转 指令 jmp 指令 将 被 执行 ， 最 
终 跳 转 到 node.elseLabel(). 

总 结 一 下 ， 条 件 表达 式 node .cond () 为 真 时 跳 转 到 node. thenLabel() 标签 ， 为 假 时 
跳 转 到 node .elseLabel () 标签 。 

跳 转 节点 和 算术 运算 节点 、 变 量 节点 等 比 起 来 简单 得 多 ， 这 是 因为 这 部 分 在 转换 成 中 间 代 
码 的 时 候 下 了 很 多 功夫 ， 因 此 在 转换 成 汇编 代码 的 时 候 就 轻松 很 多 了 。 


编译 Call 节点 


因为 函数 调用 也 是 跳 转 的 一 种 ， 所 以 接 下 来 我 们 再 看 看 表示 函数 调用 的 call 节点 的 编译 代码 。 
代码 清单 15.28 ”编译 Call 节点 ( sysdep/x86/CodeGenerator.java ) 














public Void visit(Call node) ( 
for (Expr arg : ListUtils.reverse (node.args())) { 
compile (arg); 
as.push(ax()) ; 
} 
if (node.isStaticCall()) { 
as.call(node.function().callingSymbol()); 
} 
else ( 
compile (node.expr()); 
as.callAbsolute (ax()); 
} 
// >4 bytes arguments are not supported. 
rewindStack(as, stackSizeFromWordNum(node.numArgs())); 
return null; 


) 








介绍 一 下 这 个 函数 的 总 体 结构 。 最 开始 是 foreach 语句 ， 中 间 是 if 语句 ,最 后 是 
rewindStack 方法 ， 它 们 分 别 生成 把 参数 压 栈 的 代码 、 调 用 函数 的 代码 和 回 深 栈 状态 的 代码 。 
下 面 按 顺 序 详细 讲解 各 个 部 分 。 

首先 调用 ListUtils .reverse 方法 把 实 参 node .args O WF, 按照 从 后 向 前 ( 从 右 往 
左 ) 的 顺序 处 理 。 在 cdecl 的 约定 下 ， 最 左边 的 参数 必须 出 现在 栈 顶 。 换 句 话说， 必须 把 右边 的 
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参数 先 压 栈 。 接 着 从 右边 的 参数 开始 ， 按 顺序 编译 这 些 参 数 ， 并 调用 push 方法 把 这 些 值 压 栈 。 


NS 





























让 圣 完 所 有 的 参数 后 ， 接 着 开始 调用 函数 。noqe .isSstaticcall 0 用 于 判断 这 个 函数 调用 是 直 


























接 用 函数 名 进行 调用 还 是 用 函数 指针 进行 调用 。 如 果 是 通过 函数 名 调用 ， 那 么 会 生成 普通 的 cal1 指 





$o d 























IE 


是 通过 函数 指针 调用 ， 那 么 会 生成 使 用 绝对 地 址 的 ca11 指令 , ft call **eax 这 样 。 











Call 类 的 isstaticcall 方法 用 于 判断 函数 调用 是 通过 函数 名 还 是 函数 指针 进行 的 。 如 



































果 相 当 于 £ (a) BU £ 的 表达 式 是 函数 类 型 的 变量 ,那么 £ (a) 就 是 通过 函数 名 进行 的 函数 调用 ， 








isStaticCall() 将 返回 true; WRI AF £ 的 表达 式 的 类 型 是 函数 指针 ， 那 么 £(a) 则 是 




















通过 函数 指针 进行 的 函数 调用 ， 这 个 时 候 isstaticcall () 将 返回 false。 男 外 ， WR tmn 

















类 型 既 不 是 函数 变量 也 不 是 函数 指针 ， 那 就 是 类 型 错误 ， 应 该 由 TypeChecker 抛 出 异常 。 
node.function().callingSymbol () 是 返回 调用 函数 时 的 符号 的 表达 式 。 这 个 符号 

















通常 和 也 数 名 一 致 ， 但 在 地 址 无 关 代 码 中 ， 被 调用 孔 数 是 全 局 作用 域 的 时 候 会 有 所 不 同 。 这 部 
分 的 详细 内 容 可 以 参考 第 21 章 。 





Ba, Æ call 指令 之 后 ， 也 就 是 从 函数 调用 返回 的 时 候 ， 调 用 rewindStack 方法， ^E 
成 回 滚 栈 状 态 的 代码 。rewinastack 方 法 生成 的 代码 会 把 实 参 的 栈 指 针 返 回 ， 释 放 参 数 部 分 
的 内 存 。 

栈 回 滚 的 大 小 是 “参数 个 数 4"。cbe 中 能 作为 函数 参数 的 值 都 在 4 字 节 以 下 ， 因 此 栈 上 所 
有 的 参数 都 是 4 字 节 。 所 以 参数 所 占 的 内 存 大 小 可 以 简单 地 通过 “参数 个 数 4 ”来 计算 。 


编译 Return 节点 

















最 后 讲解 cbe 对 表示 return 语句 的 中 间 代 码 节点 一 Return 节点 的 编译 过 程 。 把 
Return 节点 编译 成 汇编 代码 的 源 代码 如 代码 清单 15.29 所 示 。 
代码 清单 15.29 ”编译 Return 节点 ( sysdep/x86/CodeGenerator.java ) 











T 








public Void visit(Return node) { 


) 


if (node.expr() != null) { 
compile (node.expr()); 

) 

as.jmp(epilogue); 

return null; 





首先 ， 如 果 return 返回 的 是 表达 式 ， 那 么 要 先 编译 这 个 表达 式 。 编 译 后 的 结果 会 保留 到 
ax 寄存 器 中 ， 因 此 这 个 值 自 然 就 成 了 返回 值 〈 因为 函数 的 返回 值 是 通过 ax 寄存 器 来 传递 的 )。 

然后 ， 生 成 无 条 件 跳 转 的 jmp 指令 ， 跳 转 到 epilogue 标签 。epilogue 是 定义 在 函数 尾 
声 开头 的 标签 。 这 样 就 可 以 跳 过 函数 剩 下 的 代码 ， 结 束 函 数 调用 。 

综 上 ， 关 于 call 节点 和 Return 节点 的 编译 过 程 就 讲解 完了 。 下 一 章 将 讲解 函数 序言 和 
尾声 代码 的 生成 ， 以 及 局 部 变量 的 内 存 分 配 等 。 


























分 配 栈 帧 





本 章 主 要 讲解 函数 序言 、 尾 声 代码 的 生成 ， 局 部 
变量 的 分 配 以 及 实现 附加 功能 的 alloca 函数 。 
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本 方 将 讲解 cbe 中 栈 的 使 用 方法 和 操作 原则 。 


cbc 中 的 栈 帧 





cbe 生成 的 栈 帧 构造 如 图 16.1 所 示 。 











[|o 校 伸 展 方向 


























调用 其 他 函数 前 的 esp 
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数 的 第 1 个 参数 


















































函数 的 第 2 个 参数 
函数 的 第 3 个 参数 
函数 序言 后 的 esp 
临时 变量 
—20(%ebp) P " : 
执行 中 的 函数 的 栈 帧 
-16(96ebp) 
-12(96ebp) 
1 
—8(96ebp) 
callee-save 寄存 器 2 
—-4(96ebp) 
callee-save 寄存 器 1 
O(96ebp) | 
原 函 数 的 ebp 
4(%ebp) 





8(%ebp) 
12(%ebp) 
16(%ebp) 


上 一 个 函数 的 栈 帧 


图 16.1 cbe 的 栈 帧 
这 个 结构 和 x86 CPU 下 的 Linux 的 标准 栈 帧 结构 基本 一 致 。 


有 一 点 需要 注意 ， 图 中 的 “临时 变量 ”并 不 是 生成 中 间 代 码 时 的 临时 变量 


中 间 代 码 中 的 临时 变量 被 当成 局 部 变量 处 理 。 图 中 所 指 的 “临时 变量 ” 





EL ^ 


XE 





o TE cbe 中 ， 
15 章 中 使 用 
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virtualPush 压 栈 的 区 域 。 
另外 ， 访 问 栈 时 使 用 的 是 和 ebp 寄存 器 相对 的 内 存 引用 。 不 熟悉 汇编 语言 的 话 ， 有 时 候 会 
不 清楚 哪个 内 存 引 用 对 应 哪个 内 容 ， 因 此 在 阅读 本 章 时 遇 到 类 似 的 疑惑 时 可 以 回来 看 看 这 张 图 。 


栈 指针 操作 原则 


尽 可 能 减少 修改 栈 指针 (sp 寄存 器 ) 的 次 数 ， 是 cbe 中 的 一 个 编译 原则 。 在 cbe 生成 的 代 
码 里 ， 修 改 栈 指针 的 情况 只 有 以 下 4 种 。 

1. 函数 被 调用 后 

2. 将 其 他 函数 的 参数 压 栈 时 

3. 从 其 他 函数 返回 时 

4. 执行 alloca 函数 时 (alloca 函数 相关 的 内 容 将 在 本 章 最 后 一 节 介 绍 ) 

首先 在 函数 序言 中 生成 栈 指针 ， 以 确保 局 部 变量 和 临时 变量 的 存储 空间 。 这 和 14 章 中 描述 
的 一 致 。 

接着 ， 在 调用 其 他 函数 或 者 从 该 调用 孔 数 中 返回 时 ， 变 更 栈 指针 。 函 数 调用 时 变更 栈 指针 
是 为 了 把 参数 压 栈 ， 从 函数 返回 时 变更 栈 指针 是 为 了 恢复 栈 帧 状态 。 

最 后 ， 本 章 末 尾 讲述 的 alloca 函数 也 会 更 改 栈 指针 。 

这 里 需要 注意 一 点 ， 那 就 是 上 述 4 点 中 并 不 包括 “临时 变量 压 栈 ”。 第 15 章 中 使 用 的 
virtualPush 和 virtualPop 方法 并 不 等 同 于 实际 的 push 指令 和 pop 指令 ， 而 是 最 终 会 生 
成 move 指令 ， 因 此 也 就 不 会 更 改 栈 指针 。 为 此 ，virtualPush 方法 和 virtualPop 方法 的 
底层 实现 应 用 了 虚拟 栈 的 机 制 。 本 章 会 详细 讲解 虚拟 栈 相关 的 内 容 。 


函数 体 编译 顺序 


下 面 讲解 cbc 中 编译 函数 体 的 所 有 步 又。 编译 函数 体 的 compileFunctionBody 方 法 的 
代码 如 代码 清单 16.1 所 示 。 
代码 清单 16.1 compileFunctionBody 方法 ( sysdep/x86/CodeGenerator.java ) 








































































































private void compileFunctionBody (AssemblyCode file, DefinedFunction func) { 
StackFrameInfo frame = new StackFrameInfo(); 
locateParameters(func.parameters()); 
frame.lvarSize - locateLocalVariables(func.lvarScope()); 


AssemblyCode body = optimize(compileStmts (func)); 
frame.saveRegs - usedCalleeSaveRegisters (body); 


frame.tempSize - body.virtualStack.maxSize(); 


fixLocalVariableOffsets(func.lvarScope(), frame.lvarOffset()); 


fixTempVariableOffsets (body, frame.tempOffset ()); 


if (options.isVerboseAsm()) { 
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printStackFrameLayout(file, frame, func.localVariables()); 


) 


generateFunctionBody(file, body, frame); 


compileFunctionBody 方法 有 些 复杂 ， 下 面 用 伪 代 码 概 括 说 明 它 内 部 的 处 理 流程 。 


compileFunctionBody (AssemblyCode file, DefinedFunction func) { 
设置 访问 参数 、 局 部 变量 的 内 存 引 
编译 函数 体 
正式 生成 访问 局 部 变量 的 内 存 引 
正式 生成 访问 临时 变量 的 内 存 引 
往 file 中 添加 序言 、 函 数 体 和 尾声 的 汇编 代码 















































































































































导致 这 个 方法 的 代码 如 此 复杂 的 根本 原因 在 于 : 如 果 不 实际 进行 编译 ， 就 无 法 确认 所 需 的 
callee-save 寄存 器 的 个 数 。 如 果 不 知 道 所 需 的 callee-save 寄存 右 的 个 数 ， 就 不 能 确定 局 部 变量 
存 区 域 的 起 始 内 存 地 址 。 也 就 是 说 ， 不 实际 编译 就 无 法 确定 局 部 变量 的 内 存 引用 ， 而 显然 局 部 

















变量 的 内 存 引 用 对 于 编译 函数 体 而 言 是 必 不 可 少 的 。 
为 了 解决 这 个 问题 ，cbc 中 分 两 个 步 又 来 最 终 确定 局 部 变量 的 内 存 引 有 





























日 。 首 先 把 偏 移 量 为 空 











的 ImdirectMemoryReference 对 象 作 为 局 部 变量 的 内 存 引用 进行 编译 ， 然 后 在 编译 结束 后 





再 把 这 些 IndirectMemoryReference 对 象 的 偏 移 量 确定 下 来 。 

















另外 ， 这 里 cbe 在 生成 代码 时 使 用 的 callee-save 寄存 器 为 bx 寄存 器 ( 及 bp 寄存 器 )， 因 此 





也 可 以 通过 不 断 保 存 bx 寄存 器 的 值 来 解决 上 述 问题 。 然 而 ， 一 来 使 用 这 个 方法 对 于 这 种 情况 并 








没有 多 大 优势 ， 二 来 希望 这 段 代码 可 以 很 方便 地 转换 成 使 用 si 寄存 器 或 者 di 寄存 器 来 实现 ， 





此 虽然 稍微 复杂 一 点 ， 还 是 采用 了 上 述 分 两 个 步骤 来 实现 的 方法 。 
下 一 节 将 详细 讲解 compileFunctionBody 的 代码 。 
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本 节 将 讲解 如 何 分 配 访问 参数 和 局 部 变量 用 的 内 存 引 用 。 
本 节 概 述 


本 节 将 主要 介绍 compileFunctionBody 方法 中 的 以 下 部 分 。 
代码 清单 16.2 compileFunctionBody 方法 ( sysdep/x86/CodeGeneratorjava， 部 分 ) 





locateParameters(func.parameters()); 
frame.lvarSize - locateLocalVariables(func.lvarScope()); 


locateParameters 方法 负责 分 配 用 于 访问 参数 的 内 存 引 用 。 

而 locateLocalVariables 方法 则 负责 分 配 用 于 访问 局 部 变量 的 内 存 引 用 。 不 过 ， 上 一 
节 中 也 说 过 ， 这 里 分 配 的 内 存 引 用 是 虚拟 内 存 引 用 。 最 终 在 确定 了 需要 保存 的 callee-save 寄存 
器 的 数目 之 后 ， 还 需要 再 次 调整 相应 的 内 存 引 用 的 偏 移 量 。 


参数 的 内 存 分 配 


首先 来 看 一 下 locateParameters 方法 。 可 以 认为 参数 就 在 “发 起 函数 调用 的 原 函 数 的 ” 
栈 帧 上 。 上 有 具 体 如 图 16.2 所 示 ， 甚 位置 在 原 函 数 的 栈 帧 指针 (ebp) 以 及 返回 地 址 的 后 面 。 












































BELT PI : 执行 中 的 函数 的 栈 由 
0(%ebp) | | 








原 函 数 的 ebp 
4(%ebp) 


8(%ebp) 
PE 发 起 函数 调用 的 原 函 数 的 栈 帧 

12(%ebp) 

16(%ebp) 

20(%ebp) ! | 


! | Hk 



































E 16.2 形 参 的 位 置 


locateParameters 方法 的 实现 如 代码 清单 16.3 所 示 。 
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代码 清单 16.3 locateParameters 方法 (sysdep/x86/CodeGenerator.java) 


Static final private long PARAM START WORD = 2; 
// return addr and saved bp 


private void locateParameters(List«Parameter» params) { 
long numWords - PARAM START WORD; 
for (Parameter var : params) { 
var.setMemref (mem(stackSizeFromWordNum(numWords), bp())); 
numWords-4-; 


) 


其 中 ，PARAM START WORD 表示 形 参 在 栈 上 的 起 始 偏 移 量 ， 其 单位 为 “ 字 ”。 

F (word) 的 意思 比较 含糊 ， 根 据 不 同 的 情况 ， 有 时 候 指 的 是 “当前 CPU 下 的 原始 大 小 ”， 
有 时 候 指 的 是 “不 同 CPU 下 的 原始 大 小 ”。cbc 和 本 书 中 用 1 字 来 表示 通用 寄存 器 的 大 小 ， 也 就 
是 4 个 字 节 。 

回头 看 看 代码 。 首 先 把 表示 参数 偏 移 量 的 局 部 变量 numWwords 初始 化 为 PARAM_STRRT 
WORD， 然 后 使 用 foreach 语句 为 每 个 参数 分 配 MemoryReference。vVar.setMemref 方法 
为 参数 (KR SA Parameter 对 象 ) 设置 MemoryReference 对 象 。 另 外 ， 该 参数 的 
mem(..., bpO) 表示 的 是 bp 寄存 器 相对 的 内 存 引 用 。 

剩 下 的 就 具有 stackSizeFromWordNum 方法 了 。 如 下 所 示 ,，stackSizeFromWordNum 
方法 非常 简单 ， 仅 仅 是 把 字数 转换 成 字 节 数 。 
代码 清单 16.4 stackSizeFromWordNum 方法 (sysdep/x86/CodeGenerator.java) 






































private long stackSizeFromWordNum(long numWords) { 
return numWords * STACK WORD SIZE; 


} 
STACK WORD SIZE 表示 栈 中 1 字 的 字 节 数 ， 也 就 是 4。IA-32 约定 中 ， 把 整数 压 栈 时 通常 
就 会 占用 4 个 字 节 。 也 就 是 说 和 字数 相 乘 的 正 是 栈 上 的 字 节 数 。 
总 结 一 下 ， 就 是 从 8 ($ebp) 开始 ， 每 次 递增 1 字 (4 字 节 ) 为 各 个 参数 分 别 分 配 内 存 引 
用 。 也 就 是 说 ， 参 数 的 内 存 引用 分 别 为 8 (sepp) 、12 (%ebp) 、16 ($ebp) ……cbc 中 ， 参 数 最 
大 为 4 个 字 节 ， 并 且 分 配给 所 有 参数 的 内 存 大 小 都 一 致 ， 因 此 内 存 分 配 相 对 比较 简单 。 


局 部 变量 的 内 存 分 配 : 原则 


接 下 来 讲解 为 访问 局 部 变量 进行 的 内 存 引用 分 配 。 如 图 16.3 所 示 ， 局 部 变量 保存 在 执行 
的 函数 的 栈 帧 中 。 

除 此 以 外 ， 需 要 特别 注意 下 面 这 3 点 。 

首先 ， 这 个 图 里 只 有 1 个 callee-save 寄存 器 被 保存 到 了 栈 中 ， 实 际 上 可 能 有 2 个 ， 或 者 没 
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有 。 因 此 locateLocalVariables 方法 首先 把 没有 callee-save 寄存 需 的 情况 作为 初始 状态 为 


局 部 变量 分 配 偏 移 量 。 



































一 16(% ebp) 











—12(%eb 
did 执行 中 的 函数 的 栈 帧 
—8(%ebp) 
—4(%ebp) 
callee-save 寄存 器 
0(%ebp) | | 
HN : 前 一 个 函数 的 栈 由 
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其 次 ， 局 部 变量 和 参数 不 同 ， 很 有 可 能 是 数组 或 者 构造 体 ， 因 此 大 小 不 一 定 是 4 个 字 节 。 
另外 ， 因 为 机 融 栈 相对 而 言 更 严格 要 求 对 齐 ， 所 以 还 需要 手动 校准 数据 。 

最 后 ， 在 cbc 中 ， 当 两 个 局 部 变量 的 作用 域 不 重要 时 ， 有 可 能 被 分 配 到 同一 个 内 存 位 置 。 
壁 如 下 列 程序 被 编译 后 ，i 和 j 会 被 分 配 同一 个 内 存 位 置 。 


























sioe ie Naime m 
a (m e B) q 
int i = n * 5; 
return i; 
} else { 
aoe J c om vw omg 
return j; 


在 接 下 来 的 阅读 中 ， 请 大 家 注意 这 3 点 。 


AI 局 部 变量 的 内 存 分 配 


为 局 部 变量 分 配 内 存 引用 的 locatenocalVariables 方法 的 代码 如 代码 清单 16.5 所 示 。 
代码 清单 16.5 locateLocalVariables 方法 (sysdep/x86/CodeGenerator.java) 





private long locateLocalVariables (LocalScope scope) { 
return locateLocalVariables (scope, 0); 


} 


private long locateLocalVariables (LocalScope scope, long parentStackLen) { 
long len - parentStackLen; 
for (DefinedVariable var : scope.localVariables()) ( 
len = alignStack(len + var.allocSize()); 
var.setMemref (relocatableMem(-len, bp())); 
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long maxLen = len; 

for (LocalScope s : scope.children()) { 
long childLen - locateLocalVariables(s, len); 
maxLen - Math.max(maxLen, childLen); 


) 


return maxLen; 





第 1 个 参数 只 有 1 个 的 1ocatebocalVariables 方法 是 入 口 函 数 。 由 这 个 人口 函数 调用 
有 2 个 参数 的 locateLocalVariables 方法 ， 进 入 正式 处 理 流 程 。 

2 个 参数 的 1ocateLocalVariables 方法 负责 处 理 1 个 LocalScope 对 象 对 应 的 局 部 
变量 。LocalScope 对 象 在 Cb 中 表示 代码 块 (也 就 是 花 括号 围 起 来 的 代码 )。 这 个 方法 以 空 行 
为 界 ， 前 半 部 分 为 局 部 变量 分 配 内 存 引 用 ， 后 半 部 分 处 理子 作用 域 。 


FJ 处 理 作 用 域内 的 局 部 变量 
首先 我 们 来 看 看 locateLocalVariables 方法 的 前 半 部 分 代码 ， 如 下 所 示 。 




















long len - parentStackLen; 

for (DefinedVariable var : scope.localVariables()) ( 
len = alignStack(len i var.allocSize()); 
var.setMemref (relocatableMem(-len, bp())); 


) 


变量 len 表示 目前 为 止 分 配 的 局 部 变量 区 域 的 大 小 。 首 先 把 这 个 变量 len 初始 化 为 方法 的 
第 2 个 参数 parentstackLen。parentStackLen 指 的 是 父 作 用 域 中 分 配 的 内 存 大 小 。 

第 2 行 的 foreach 语句 对 作用 域内 的 各 个 局 部 变量 分 别 分 配 内 存 引 用 。 在 £oeach 语句 内 的 
第 1 行 ,把 Len 变量 增加 1 个 变量 的 大 小 ， 并 调用 alignStack 方法 校准 len 变量 。 

通过 var.allocSsize() 可 以 求 得 1 个 局 部 变量 的 大 小 。 这 个 值 的 单位 是 字 节 ， 辟 如 
char 类 型 的 变量 是 1，int 类 型 的 变量 则 是 4。 局 部 变量 的 类 型 是 数组 或 者 构造 体 的 时 候 ， 也 
可 以 遵照 第 12 章 中 介绍 的 规则 正确 地 计算 出 大 小 。 各 个 Type 类 中 封装 了 计算 大 小 的 size F 
法 ， 感 兴趣 的 话 可 以 参照 相关 代码 。 

最 后 调用 var .setMemref 方法 分 配 内 存 引 用 。relocatableMem 方法 和 mem 方法 的 实 
现 几 乎 一 致 ， 只 是 在 其 内 部 实现 中 会 设立 一 个 标志 位 ， 用 于 表示 偏 移 量 可 变 。 

接 下 来 就 剩 计算 局 部 变量 的 偏 移 量 了 。relocatableMem 方法 的 第 1 个 参数 ( 偏 移 量 ) 中 
被 传人 -len。 为 什么 是 -len WE? 局 部 变量 的 大 小 和 偏 移 量 的 关系 如 图 16.4 所 示 ， 可 供 参 考 。 

第 1 个 局 部 变量 的 大 小 为 4 字 节 ,合计 内 存 大 小 为 4 字 节 。 这 个 局 部 变量 的 偏 移 量 为 -4。 
第 2 个 局 部 变量 的 大 小 为 8 字 节 ,合计 内 存 大 小 为 12 字 节 。 这 个 局 部 变量 的 偏 移 量 就 是 -12。 
也 就 是 说 ,合计 内 存 大 小 (1len ) 加 上 负 号 之 后 就 是 对 应 局 部 变量 的 偏 移 量 了 。 这 就 是 局 部 变 
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量 的 偏 移 量 表 示 为 -len 的 原因 。 








， 十 栈 伸展 方向 
-16(%ebp) | 





-12(96ebp) 


—-4(96ebp) 








O(96ebp) l 
BES 
图 16.4 ”局 部 变量 的 偏 移 量 


对 齐 的 计算 


alignStack 方法 的 实现 如 下 。 
代码 清单 16.6 alignStack 方法 (sysdep/x86/CodeGenerator.java) 





private long alignStack(long size) { 
return AsmUtils.align(size, STACK WORD SIZE); 


) 











具体 而 言 ， 就 是 使 用 AsmUtils.align 方 法 ,返回 “大 于 等 于 size 的 STRACK_NORD 
SIZE 的 最 小 倍数 "。sTACK_WORD_SIZE 常量 的 值 为 4， 因 此 如 果 size 为 1、2、3、4 之 
中 的 一 个 ， 那么 al1ignstack 的 返回 值 为 4。 如 果 size 为 5、6、7、8 之 中 的 一 个 ， 那 么 
alignStack 的 返回 值 为 8。 

AsmUtils.align 的 代码 如 下 所 示 。 
代码 清单 16.7 align 方法 (utils/AsmUtils.java) 


static public long align(long n, long alignment) { 
return (n + alignment - 1) / alignment * alignment; 


) 


align 方法 返回 “大 于 等 于 n 的 a 的 最 小 倍数 "。 对 于 任意 正 整数 n 和 a, mn / a * a 就 是 
“小 于 等 于 nn 的 a 的 最 大 倍数 "， 因 此 了 加 上 (a-1) 后 再 进行 同样 的 运算 就 可 以 得 到 “大 于 等 
Tni] a 的 最 小 倍数 "。 PRIN AE 


F3 7 子 作用 域 变量 的 内 存 分 配 
最 后 来 看 看 locateLocalVariables 方法 后 半 部 分 处 理子 作用 域 的 代码 。 
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代码 清单 16.8 locateLocalVariables 方法 (后 半 部 分 ，sysdep/x86/CodeGenerator.java) 


long maxLen = len; 

for (LocalScope s : scope.children()) { 
long childLen = locateLocalVariables(s, len); 
maxLen - Math.max(maxLen, childLen); 


) 


return maxLen; 


使 用 foreach 语句 遍历 子 作 用 域 列表 scope.children () ， 递 归 地 调用 locateLocalvariables 
方法 进行 处 理 。 

这 里 要 注意 ， 对 于 所 有 的 子 作 用 域 ，1ocateLocalVatriables 方法 的 第 2 个 参数 传人 的 
都 是 同一 个 值 (LIen )。 这 个 处 理 使 得 所 有 子 作 用 域内 为 局 部 变量 分 配 的 都 将 是 同一 个 位 置 的 内 
存 引 用 。 辟 如 下 列 函 数 的 作用 域 将 得 到 如 图 16.5 所 示 的 内 存 分 配 。 
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lien 
16.5 ” 重 琶 的 局 部 变量 的 内 存 分 配 
另外 ， 这 段 代 码 也 计算 了 包含 子 作 用 域 在 内 的 所 有 局 部 变量 所 占 的 内 存 大 小 。 变 量 
maxLen 就 是 包含 子 作 用 域 在 内 的 所 有 局 部 变量 所 占 的 内 存 大 小 。 假 设 现 在 正在 处 理 作用 域 1， 
则 作用 域 1 自身 的 局 部 变量 所 占 的 内 存 大 小 为 1en， 而 包含 了 作用 域 1 的 子 作用 域 的 局 部 变量 ， 
其 最 大 内 存 大 小 为 maxLen。 
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利用 虚拟 栈 分 配 临 时 变量 








本 节 将 讲解 cbe 中 临时 变量 的 实现 。 


F 虚拟 栈 的 作用 

首先 来 看 如 何 使 用 虚拟 栈 为 临时 变量 分 配 内 存 。 虚 拟 栈 指 的 是 为 了 把 push fil pop 对 应 的 
内 存 访问 替换 成 mov 指令 对 应 的 内 存 访问 而 设计 的 机 制 。 

我 们 以 下 列 汇编 代码 为 例 来 思考 一 下 。 














pushl $eax 
pushl S$ecx 
pushl $esi 


popl %ecx 
pop! $eax 
popi $esi 


类 似 这 样 压 栈 和 出 栈 操作 一 一 对 应 的 情况 下 ， 完 全 可 以 把 push 指令 和 pop 指令 蔡 换 成 以 
下 使 用 sebp 的 mov 指令 。 


movil $eax, -A4($ebp) # pushl $eax 
movil $ecx, -8($ebp) # pushl S$ecx 
movil esq 12 (ee) # pushl $esi 
movil -12(€$ebp), $ecx # popl S$ecx 
movil -8($ebp), $eax # popl $eax 
movl -4 (%ebp), $esi # popl $esi 


push 189 fll pop 指令 通过 更 改 ebp 寄存 器 的 值 0 (sebp) ,来 每 次 访问 不 同 的 内 存 地 址 。 
但 上 述 代码 并 不 更 改 ebp 寄存 器 的 值 ， 而 是 通过 改变 与 ebp 寄存 器 的 偏 移 量 ,来 每 次 访问 不 同 
的 内 存 地 址 。cbe 的 虚拟 栈 正 是 通过 计算 相对 ebp 寄存 器 的 偏 移 量 ， 而 把 压 栈 出 栈 操作 替换 成 上 
述 mov 指令 的 一 种 机 制 。 

不 过 ， 这 里 重复 强调 一 下 ， 当 日 仅 当 push SF pop 指令 正确 地 一 一 对 应 时 ， 才 可 以 把 
push 指令 和 pop 指令 替换 成 mov 指令 。 

男 外 ， 当 栈 帧 非 空 时 ， 如 果 push M pop 以 外 的 指令 更 改 了 ebp 寄存 器 的 值 ， 则 这 种 替换 
也 不 适用 。 因 为 这 种 情况 下 无 法 正确 计算 偏 移 量 。 不 过 一 般 情 况 下 这 个 条 件 是 自然 成 立 的 ， 而 
cbe 生成 的 代码 也 总 会 符合 必要 条 件 。 
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虚拟 栈 的 接口 


下 面 讲解 虚拟 栈 的 接口 。 

虚拟 栈 的 主要 接口 是 AssemblyCode 类 的 virtualPush 方法 和 virtualPop 方法 。 使 
用 这 两 个 方法 可 以 使 生成 的 代码 中 用 mov 指令 代替 push 指令 和 pop 指令。 这些 方法 在 第 15 
章 中 我 们 就 已 经 多 次 用 到 。 








表 16.1 虚拟 栈 相关 的 方法 
JIER 效果 
成 把 reg 的 值 压 入 虚拟 栈 的 代码 
EF 成 从 虚拟 栈 中 出 栈 并 赋值 给 reg 的 代码 








virtualPush(Register reg) 


ir Lir 

















virtualPop(Register reg) 











virtualPush 方 法 和 virtualPop 方 法 内 部 都 使 用 Virtualstack 类 来 计算 相对 
T $ebp 的 偏 移 量 。VirtualSstack 类 用 于 保存 “目前 ”相对 于 $ebp 的 偏 移 量 ， 其 内 部 定义 
了 如 表 16.2 所 示 的 方法 。 














表 16.2 VirtualStack 类 的 方法 












































方法 效果 

extend(long n) 把 虚拟 栈 增 大 n 字 节 

rewind(long n) 把 虚拟 栈 缩小 n 字 节 

top() 返回 访问 虚拟 栈 项 端 元 素 的 内 存 地 址 
reset() ( 再 次 ) 初始 化 虚拟 栈 




















下 面 将 按 顺序 讲解 这 些 方法 的 实现 。 


虚拟 栈 的 结构 


首先 介绍 VirtualStack 类 的 结构 。 代 码 清单 16.9 中 展示 了 Virtualstack 类 的 属性 和 
构造 函数 。 
代码 清单 16.9 VirtualStack 类 的 属性 (sysdep/x86/AssemblyCode.java) 


class VirtualStack { 
private long offset; 











private long max; 
private List«IndirectMemoryReference» memrefs - 
new ArrayList«IndirectMemoryReference»(); 


VirtualStack() ( 
reset(); 


) 


void reset() { 
offset - 0; 
max - 0; 
memrefs.clear(); 
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) 
其 中 ，offset 属性 是 目前 相对 于 sebp 的 偏 移 量 。x86 下 栈 是 向 内 存 地 址 0 的 方向 伸展 
的 ， 因 此 栈 越 伸展 ， 偏 移 量 越 小 。 不 过 offset 属性 与 之 相反 ， 栈 越 伸 展 ， 其 值 越 大 。 
max 属性 是 offset 到 目前 为 止 的 最 大 值 。 最 后 的 memrefs 属性 用 于 保存 类 似 
于 -4 ($ebp) 这 样 的 访问 栈 所 需 的 内 存 引 用 。memrefs 中 保存 的 内 存 引用 在 之 后 调整 临时 变 
量 的 偏 移 量 时 可 以 派 上 用 场 。 
另外 ，VirtualStack 类 的 实例 会 在 AssemblyCode 对 象 的 virtualstack 属性 中 保存 。 


virtualPush 方法 的 实现 


接 下 来 讲解 virtualPush 方法 。virtualPush 方法 的 代码 如 代码 清单 16.10 所 示 。 
代码 清单 16.10 virtualPush 方法 (sysdep/x86/AssemblyCode.java) 
























































void virtualPush(Register reg) ( 
if (verbose) { 
comment("push " + reg.baseName() + " -> " + virtualStack.top()); 
) 
virtualStack.extend(stackWordSize); 
mov (reg, virtualStack.top()); 





if (verbose) 这 里 的 代码 是 生成 注释 用 的 ， 这 里 先 忽略 掉 。 首 先 ， 调 用 virtualStack. 
extend(stackWordSize) 语句 ， 令 虚拟 栈 伸展 stackWordSize XAK. stackWordSize 
和 CodeGenerator 类 的 STACK WORD SIZE 同 值 ， 都 是 4。 

接着 调用 mov 方法 ， 生 成 把 reg 寄存 需 的 值 传人 虚拟 栈 顶 端的 mov 指令 。virtualstack. 
top () 返回 的 是 表示 当前 虚拟 栈 顶 端的 内 存 地 址 的 IndirectMemoryReference 对 象 。 


























VirtualStack#extend 方法 的 实现 


接 下 来 看 看 Virtualstack 类 中 extend 方法 和 top 方法 的 实现 。 首 先 讲解 extend 方法 。 
代码 清单 16.11 VirtualStack 类 的 extend 方法 (sysdep/x86/AssemblyCode.java) 








void extend(long len) { 
offset += len; 
max = Math.max (offset, max); 


} 





这 个 实现 很 简单 ， 就 是 令 offset 增加 len， 并 更 新 max 变量 。 
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VirtualStack#top 方法 的 实现 


下 面 是 virtualStack 类 的 top 方法 。 
代码 清单 16.12  VirtualStack 类 的 top 方法 (sysdep/x86/AssemblyCode.java) 





IndirectMemoryReference top() ( 
IndirectMemoryReference mem - relocatableMem(-offset, bp()); 
memrefs.add (mem); 
return mem; 


) 


首先 调用 zelocatab1leMem 方 法 ， 生 成 访问 栈 顶 的 IndirectMemoryReference 对 象 。 
relocatableMem 方 法 与 mem 方 法 几乎 一 致 ， 只 是 其 生成 的 IndirectMemoryReference 对 象 
的 偏 移 量 在 之 后 可 能 会 发 生变 更 。relocatableMem 方法 生成 的 IndirectMemoryReference 
对 象 表示 的 是 类 似 于 -4 (&ebp) 这 样 的 、 使 用 bp 寄存 带 的 间接 内 存 引 用 。 
接 下 来 执行 memrefs .add (mem), ， 把 刚刚 生成 的 对 象 添 加 到 memrefs 中 保存 起 来 。 
最 后 返回 生成 的 IndirectMemoryReference 对 象 ， 执 行 结 


virtualPop 方法 的 实现 


接着 讲解 virtualPop 方法 的 实现 。virtualPop 方法 的 代码 如 代码 清单 16.13 所 示 。 
代码 清单 16.13 virtualPop 方法 (sysdep/x86/AssemblyCode.java) 


























void virtualPop (Register reg) { 
if (verbose) { 
comment ("pop " + reg.baseName() + " <- " + virtualStack.top()); 


) 


mov(virtualStack.top(), reg); 
virtualStack.rewind(stackWordSize); 


里 也 忽略 最 开始 的 if 语句 。 首 先 利 用 mov 方法 生成 从 虚拟 栈 顶 内 存 地 址 把 值 载 人 reg 
中 的 指令 。 接 着 执行 virtualStack.rewind(stackWordSsize)， 使 得 虚拟 栈 缩小 
stackWordSsize， 也 就 是 4 个 字 节 。 
以 上 就 是 对 virtualPop 方法 的 说 明 。 





VirtualStack#rewind 方法 的 实现 


最 后 我 们 来 看 看 VirtualStack 类 的 rewind 方法 的 实现 。 
代码 清单 16.14 _ VirtualStack 类 的 rewind 方法 (sysdep/x86/AssemblyCode.java) 





void rewind(long len) ( 
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offset -= len; 


) 


这 段 代 码 的 意义 一 目 了 然 。offset 变量 减 去 1en， 然 后 执行 结 


虚拟 楼 的 运作 


在 本 节 的 最 后 让 我 们 来 总 结 一 下 虚拟 栈 的 运作 流程 。 表 16.3 中 列举 了 所 执行 的 
virtualPop 和 virtualPush 语句、 生成 的 mov 指令 和 方法 执行 后 offset 属性 的 值 等 ， 
大 家 可 以 结合 这 些 操作 来 理解 虚拟 栈 的 运作 流程 。 























表 16.3 ”虚拟 栈 以 及 生成 的 指令 


























执行 的 方法 生成 的 指令 offset 属性 
( 执行 前 ) 0 
virtualPush(ax(); movl 96eax, -4(96ebp) 4 
virtualPush(cx(); movl 96ecx, -8(96ebp) 8 
virtualPush(si(); movl 96esi, -12(96ebp) 12 
virtualPop(cx(); movl -12(96ebp), 96ecx 8 
virtualPop(ax(); movl -8(96ebp), 96eax 4 
virtualPop(si()); movl -A(96ebp), 96esi 0 
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调整 栈 访 问 的 偏 移 量 








本 节 将 讲述 局 部 变量 以 及 临时 变量 的 偏 移 量 调整 。 
ESI 
本 节 主要 讲述 compileFunctionBody 方法 中 与 局 部 变量 和 临时 变量 的 偏 移 量 调整 相关 


的 部 分 。 具 体 的 代码 如 代码 清单 16.15 所 示 。 
代码 清单 16.15 ”compileFunctionBody 方法 (sysdep/x86/CodeGenerator.java, 部 分 ) 








AssemblyCode body = optimize(compileStmts(func)); 
frame.saveRegs - usedCalleeSaveRegisters (body); 
frame.tempSize = body.virtualStack.maxSize(); 


fixLocalVariableOffsets(func.lvarScope(), frame.lvarOffset()); 
fixTempVariableOffsets (body, frame.tempOffset()); 


第 1 行 生 成 函数 体 的 汇编 代码 并 优化 。 接 着 调用 usedcalleeSaveRegisters 方 法 ， 
求 得 这 段 汇编 代码 中 使 用 到 的 callee-save 寄存 器 。 第 3 行进 一 步调 用 Virtualstack 类 的 
maxSize 方 法 ， 得 到 临时 变量 分 配 的 内 存 大 小 。 

在 空 行 后 面 的 代码 中 ， 首 先 调 用 fixLocalVariableoffsets 方法 ， 调 整 分 配给 局 部 变 
量 的 内 存 引 用 的 偏 移 量 。 接 下 来 调用 fixTempVariableOffsets 方 法， 调整 临时 变量 所 分 
配 到 的 内 存 引 用 的 偏 移 量 。 

以 上 就 是 整个 处 理 流程 的 概要 。 接 下 来 按 顺 序 详细 进行 讲解 。 















































StackFramelnfo 类 








首先 讲解 上 述 代码 中 忽然 出 现 的 frame 变量 。frame 变量 中 保存 的 是 一 个 StackFrameInfo 
对 象 。StackFrameInfo 类 是 CodeGenerator 类 中 的 内 部 类 ， 它 的 作用 是 保存 处 理 中 的 淆 
数 的 栈 帧 信息 。 


StackFrameInfo 类 的 定义 如 代码 清单 16.16 所 示 。 


代码 清单 16.16  StackFramelnfo 类 (sysdep/x86/CodeGenerator.java) 


class StackFrameInfo { 
List«Register» saveRegs; 
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long lvarSize; 
long tempSize; 


long saveRegsSize() { return saveRegs.size() * STACK WORD SIZE; } 


long lvarOffset() ( return saveRegsSize(); ] 
long tempOffset() { return saveRegsSize() + lvarSize; } 
long frameSize() { return saveRegsSize() + lvarSize + tempSize; } 








saveRegs 属性 中 保存 的 是 callee-save 寄存 器 列表 ， 其 他 属性 以 及 方法 都 表示 栈 帧 中 特定 
部 分 的 大 小 。 各 个 属性 和 方法 的 含义 如 图 16.6 所 示 。 


























callee-save 寄存 器 保存 区 





图 16.6 StackFramelnfo 的 属性 和 方法 表示 的 长 度 


计算 正在 使 用 的 callee-save 寄存 器 


下 面 直接 切入 对 代码 的 讲解 。 usedCalleeSaveRegisters 方 法 讲 起 。 
usedCalleeSaveRegisters 方法 返回 函数 中 使 用 到 的 callee-save 寄存 器 列表 。 其 实现 代码 
如 代码 清单 16.17 所 示 。 


代码 清单 16.17 usedCalleeSaveRegisters 方法 (sysdep/x86/CodeGenerator.java) 




















private List«Register» usedCalleeSaveRegisters (AssemblyCode body) { 
List«Register» result = new ArrayList«Register»(); 
for (Register reg : calleeSaveRegisters()) { 
if (body.doesUses (reg)) { 
result.add(reg); 
) 
) 


result.remove (bp()); 
return result; 


) 


首先 第 1 行 初始 化 了 一 个 空 的 ArrayList 对 象 。 接 着 调用 calleeSaveRegisters 
方法 获取 callee-save FFAIR, JFE JH foreach 语句 遍历 这 个 列表 。 之 后 调用 bodqy . 
doesUses (reg) 判断 函数 体 是 否 使 用 了 这 个 寄存 器 ， 如 果 使 用 过 ， 则 把 寄存 器 加 入 到 
result 里 。 

最 后 ， 执 行 result .remove (bp () ) 把 bp 寄存 器 从 result 中 移 除 。 因 为 在 cbe 中 , 无 
论 是 否 使 用 bp 寄存 器 ， 都 会 对 它 的 值 进行 备份 ， 所 以 还 是 不 要 把 它 放 到 返回 值 里 面 比较 好 。 
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39h, AssemblyCode 类 的 doesUses 方法 用 于 判定 在 一 个 AssemblyCode 对 象 内 某 个 
特定 的 寄存 器 是 否 被 使 用 过 。 因 为 Assemblycode 对 象 保存 了 每 个 寄存 器 被 使 用 的 次 数 ， 所 
以 这 个 方法 的 实现 非常 简单 。 

而 确认 每 个 寄存 器 被 使 用 的 次 数 的 方法 就 是 遍历 所 有 的 汇编 对 象 ， 对 Register 对象 进 行 
计数 。 这 个 实现 不 复杂 ， 并 且 很 单调 ， 所 以 这 里 就 略 过 不 提 了 。 


[F3 计算 临时 变量 区 域 的 大 小 


接 下 来 讲解 如 何 计算 临时 变量 区 域 的 大 小 。 在 compileFunctionBody 方法 中 ,下 面 这 1 
行 代码 实现 了 这 个 需求 。 























frame.tempSize - body.virtualStack.maxSize(); 


所 有 临时 变量 都 由 虚拟 栈 分 配 内 存 ， 因 此 虚拟 栈 的 最 大 内 存 偏 移 量 就 是 临时 变量 区 域 的 大 
小 。Virtualstack 类 的 maxsize 方法 可 以 返回 一 个 虚拟 栈 的 最 大 内 存 偏 移 量 。 其 内 部 实现 
其 实 就 是 返回 虚拟 栈 的 max 属性 的 值 。 


F3 调整 局 部 变量 的 偏 移 量 


接 下 来 讲解 如 何 调整 局 部 变量 的 偏 移 量 。 具 体 而 言 ，compileFunctionBody 方法 中 下 面 
这 部 分 代码 实现 了 这 个 需求 。 






























































fixLocalVariableOffsets(func.lvarScope(), frame.lvarOffset()); 


func.lvarScope () 方法 返回 func 函数 体 的 作用 域 所 对 应 的 LocalScope 对 象 。 
frame.lvarOffset () 返回 局 部 变量 领域 的 偏 移 量 。 

fixLocalVariableOffsets 方法 的 代码 如 下 所 示 。 
代码 清单 16.18 fixLocalVariableOffsets 方法 (sysdep/x86/CodeGenerator.java) 


private void fixLocalVariableOffsets(LocalScope scope, long len) { 
for (DefinedVariable var : scope.allLocalVariables()) { 
var.memref().fixOffset(-len); 


) 
) 
首先 调用 scope.allLocalVariables.() 得 到 当前 作用 域 下 的 所 有 局 部 变量 ， 然 后 用 
foreach 语句 遍历 。 对 每 一 个 局 部 变量 的 memzref 调用 £ixoffset 方法 ， 为 每 个 变量 的 偏 移 量 
加 上 -1en， 也 就 是 减 去 1en。 这 里 要 注意 一 点 ，len 通常 是 正 数 ， 因 此 在 类 似 于 x86 这 样 的 
栈 伸 展 方向 是 内 存 地 址 0 的 架构 下 ,做 -len 这 样 的 符号 变换 是 很 必要 的 。 


























326 | 第 16 章 ABE 


F3 调整 临时 变量 的 偏 移 量 


最 后 来 看 看 临时 变量 的 偏 移 量 调整 。compileFunctionBody 方法 中 实现 这 个 需求 的 代码 
如 下 所 示 。 














fixTempVariableOffsets (body, frame.tempOffset()); 


body 是 表示 函数 体 的 Assemblycode XZ, frame.tempoffset () 表示 临时 变量 区 域 
的 起 始 偏 移 量 。 

fixTempVariableOffsets 方法 的 代码 如 下 所 示 。 
代码 清单 16.19 fixTempVariableOffsets 方法 (sysdep/x86/CodeGenerator.java) 




















private void fixTempVariableoffsets (AssemblyCode asm, long len) ( 
asm.virtualStack.fixOffset(-len); 


) 
XÍ asm) VirtualStack 对 象 调 用 fixoffset 方法 ， 令 这 个 VirtualStack 对 象 生成 
的 所 有 IndirectMemoryReference 对 象 的 偏 移 量 同时 加 上 -len， 也 就 是 减 去 lens 
VirtualStack 对 象 的 fixOffset 方法 对 memrefs 中 所 有 的 IndirectMemoryReference 
对 象 进行 遍历 ， 调 用 这 些 对 象 各 自 的 £ixoffset 方法 。 
以 上 就 是 局 部 变量 以 及 临时 变量 的 偏 移 量 调整 。 到 此 为 止 ， 函 数 体 的 编译 、 内 存 引用 的 偏 
移 量 调整 以 及 所 有 栈 帧 的 信息 收集 都 已 经 完成 ， 剩 下 的 工作 就 具有 生成 函数 序言 和 尾声 了 。 
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am 5 生成 函数 序言 和 尾声 











本 方 将 讲解 如 何 生 成 函数 序言 和 尾声 。 


F3 本 节 概 要 





本 方 中 我 们 将 会 利用 目前 已 有 的 所 有 信息 ， 











生成 函数 的 序言 和 尾声 代码 。 具 体 实现 在 





generateFunctionBody 方法 中 ， 


其 代码 如 代码 清单 16.20 所 示 。 


代码 清单 16.20 generateFunctionBody 方法 (sysdep/x86/CodeGenerator.java) 


private void generateFunctionBody (AssemblyCode file, 


AssemblyCode body, 
file.virtualStack.reset(); 


prologue(file, frame.saveRegs, 


if (options.isPositionIndependent () 


loadGOTBaseAddress (file, 
} 
file.addAll(body.assemblies()); 
epilogue(file, frame.saveRegs); 
file.virtualStack.fixOffset(0); 


) 


StackFrameInfo frame) { 


frame.frameSize()); 
&& body.doesUses (GOTBaseReg())) { 
GOTBaseReg()); 


B file.virtualStack 调用 reset 方法 ， 初始 化 file 的 虚拟 栈 。 注 意 上 一 节 中 
说 到 的 虚拟 栈 指 的 是 body .virtualstack， 和 这 里 初始 化 的 file.virtualStack 不 同 。 

















接着 调用 prologue 方法 生成 函 


紧 接着 的 if 语句 可 以 忽略 掉 。 这 部 分 和 第 


数 的 序言 代码 。 
; 21 草 中 的 地 址 无 关 代 码 相关 。 


接 下 来 执行 file.adadAl1， 把 函数 体 的 汇编 代码 全 部 添加 到 file PÆ. 


之 后 调用 epilogue 生成 函数 的 尾声 代码 。 




















最 后 1 行 的 作用 是 调整 £ile.virtualStack 对 象 生成 的 IndirectMemoryReference 


对 象 的 仿 移 量 。 虽 说 如 此 ， 因 为 参数 为 0， 所 以 事 





FJ 生成 函数 序言 





实 上 偏 移 量 的 值 并 没有 改变 。 





下 面 我 们 来 看 看 生成 函数 序言 的 代码 。 生 成 函数 序言 的 prologue 方法 的 代码 如 代码 清单 


16.21 所 示 。 
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代码 清单 16.21 prologue 方法 (sysdep/x86/CodeGenerator.java) 


private void prologue (AssemblyCode file, 
List«Register» saveRegs, long frameSize) ( 
file.push(bp()); 
file.mov(sp(), bp0); 
for (Register reg : saveRegs) [ 
file.virtualPush(reg); 


) 


extendStack(file, frameSize); 


) 








首先 调用 push 方 法， 生成 把 bp 寄存 器 压 栈 的 指令 。 接 着 调用 mov WIR, JE sp 寄存 器 的 


值 存 入 bp 寄存 器 。 这 样 就 完成 了 bp 寄存 器 的 初始 化 。 





接 下 来 使 用 foreach 语句 遍历 saveRegs。saveRegs 是 需要 保存 的 callee-save 寄存 


器 的 列表 。 把 这 些 寄存 器 按 顺 序 传人 人 virtualPush 方 法， 生成 压 栈 的 代码 。 不 过 因为 





Ei 
AE 


virtualPush 方 法， 所 以 事实 上 使 用 的 并 不 是 push 指令 ， 而 是 mov 指令 。 这 样 就 生成 了 保 





ff callee-save 寄存 器 的 代码 。 


最 后 调用 extendqSstack 方 法 ， 生 成 令 机 器 栈 伸展 frameSsize 个 字 节 的 代码 。 


extendStack 方法 的 代码 如 代码 清单 16.22 所 示 。 
代码 清单 16.22 ”extendStack 方法 (sysdep/x86/CodeGenerator.java) 


private void extendStack(AssemblyCode file, long len) { 
if (len > 0) { 
file.sub(imm(len), sp()); 
) 
) 


这 段 代 码 的 含义 很 直观 : 当 len 大 于 0 时 ， 调 用 sub 指令 使 sp 寄存 器 的 值 减 去 len. 


生成 函数 尾声 

















最 后 讲解 一 下 生成 函数 尾声 代码 的 epilogue 方法 (代码 清单 16.23 )。 
代码 清单 16.23  epilogue 方法 (sysdep/x86/CodeGenerator.java) 








private void epilogue(AssemblyCode file, List«Register» savedRegs) { 
for (Register reg : ListUtils.reverse(savedRegs)) { 
file.virtualPop (reg); 
) 
file.mov(bp(), spO); 
file.pop(bp()); 
file.ret(); 


) 











最 开头 的 foreach 语 句 生 成 了 恢复 在 函数 序言 中 保存 到 机 器 栈 中 的 callee-save 寄存 器 的 代 
人 码 。 利 用 ListUtils.reverse 把 saveRegs， 即 保存 的 callee-save 寄存 器 列表 进行 倒序 ， 并 
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通过 foreach 语句 进行 遍历 。 这 里 要 注意 ， 如 果 不 先 对 savedRegs 进行 倒序 ， 将 无 法 正确 恢复 
先前 压 入 机 带 栈 的 值 。 

接 下 来 调用 mov 方法 和 pop 方法 ， 生 成 恢复 sp 寄存 器 和 bp 寄存 器 的 代码 。 

最 后 调用 ret 方法 ， 生 成 ret 指令 。 

这 样 函 数 的 尾声 代码 也 成 功 生 成 了 。 到 此 为 止 所 有 函数 相关 的 代码 ,包括 函 数 序言 、 函 数 
尾声 等 ， 都 已 经 成 功 生 成 。 只 要 再 为 国 数 添加 标签 ， 定 义 好 全 局 变量 和 字符 串 常 量 ， 整 个 编译 
工作 就 全 部 完成 了 。 不 过 剩 下 的 编译 工作 和 暂 日 告 一 段落 ， 放 到 第 21 章 再 叙 ， 下 面 我 们 聊 一 聊 别 
的 话题 。 
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alloca 函数 的 实现 








本 节 将 讲解 一 个 和 机 器 栈 关 系 菲 浅 的 函数 一 一 al1loca 函数 和 它 的 实现 。 


什么 是 alloca 函数 


首先 ，alloca KAO LUE EZ C 语言 中 的 alloca 函数 的 简化 版 。 不 过 这 里 的 alloca 
函数 是 怎样 的 呢 ? 

alloca 函数 用 于 申请 机 需 栈 上 任意 长 度 的 区 域 。 可 以 看 作 是 malloc 函数 的 机 器 栈 版 本 。 
alloca 因数 的 男 数 声明 如 下 所 示 。 




















Hinclude <stdlib.h> 


void* alloca(size t size); 


壁 如 要 声明 一 个 16 FRIKE, "TEUER P IBDXEETOH alloca PRA. 








ehar iper Malte cao) 


alloca 函数 只 是 声明 机 器 栈 上 的 区 域 ， 因 此 申请 到 的 区 域 也 保留 了 机 器 栈 的 特性 。 也 就 
是 说 ， 当 某 个 调用 了 alloca 函数 的 函数 体 执行 完毕 后 ， 由 alloca 声明 的 区 域 就 会 被 释放 掉 。 

另外 ，alloca 函数 的 实现 严重 依赖 编译 右 生 成 的 代码 ， 因 此 并 没有 通用 的 实现 。 一 般 标 
iE C 库 里 不 包含 alloca， 而 是 由 具体 的 编译 器 来 提供 其 实现 。 璧 如 在 gcc 中 就 是 以 内 置 函数 
”builtin alloca 的 形式 来 实现 的 。 


实现 原则 


下 面 讲 解 alloca 函数 的 实现 原则 。 请 参考 图 16.7， 这 是 之 前 介绍 过 的 cbe 中 的 栈 帧 图 。 
cbe 的 alloca 函数 用 于 申请 临时 变量 区 域 以 及 参数 区 域 之 间 的 内 存 。 总 之 ， 将 图 16.7 中 
的 esp #1 变 为 esp #2 即 可 。 
































16.6 alloca 函数 的 实现 | 331 


















































esp #3 | | 调用 函数 前 
调用 函数 的 参数 
esp #2 上 - | 调用 alloca 后 
alloca 保留 的 区 域 
esp #1 — | 执行 序言 代码 后 
[By db e 























—-A4(96ebp) 





16.7 cbc 的 栈 帧 


alloca 函数 的 影响 


alloca 函数 用 非常 规 的 方法 改变 了 栈 指针 ， 这 会 不 会 对 其 他 代码 造成 影响 呢 ? 这 一 点 需 
要 慎之 又 慎 。 

首先 ， 局 部 变量 和 临时 变量 使 用 的 是 和 bp 寄存 器 相对 的 内 存 地 址 ， 无 论 栈 指针 怎样 改变 都 
不 会 有 所 影响 。 事 实 上 ， 原 本 这 个 设计 就 是 为 了 避免 alloca 函数 造成 的 影响 。 

其 次 ， 当 函数 的 实 参 压 栈 时 会 怎样 呢 ? cbe 中 将 函数 的 实 参 压 栈 时 不 使 用 虚拟 栈 ， 而 是 使 
用 push 指令 。 因 此 ,无 论 alloca 困 数 如 何 改变 栈 指 针 ， 都 可 以 在 其 之 上 正确 压 栈 。 

最 后 ,在 C 语言 中 ， 像 下 面 这 样 在 参数 中 调用 alloca 函数 时 ， 其 结果 无 法 保证 。 























peiner (ue Cg, Crohn, 5 gublexem, "DE 


在 这 种 情况 下 ， 若 执行 参数 表达 式 并 压 栈 ,那么 当 第 4 个 参数 7 压 栈 之 后 ，alloca 函数 
就 被 执行 了 。 也 就 是 说 ， 这 个 时 候 alloca 函数 申请 了 栈 上 第 4 个 参数 和 第 2 个 参数 之 间 的 区 
域 。 这 就 是 alloca 函数 “一 般 情 况 下 ”不 能 在 其 他 函数 的 参数 中 使 用 的 理由 。 

虽说 如 此 ，cbc FRE alloca 函数 在 其 他 函数 的 参数 中 使 用 ， 也 不 会 引发 问题 。 因 为 cbe 
会 把 上 述 代 码 转换 成 如 下 指令 








void *tmpO - alloca(4); 
pear S cS TES chr Sp ona, NE 


使 用 alloca 函数 带 来 的 副作用 就 这 么 被 中 间 代 码 转换 带 来 的 好 处 抵消 了 。 
[FJ alloca 函数 的 实现 


下 面 讲解 cbc alloca AAJ., cbe 的 alloca KAE libcbc.a 这 个 库 里 。 使 用 
cbe 执行 链接 命令 后 ，1ibcbc .a 会 被 自动 链接 。 因 此 alloca 函数 可 以 在 程序 中 正常 使 用 。 
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alloca 函数 的 实现 如 代码 清单 16.24 所 示 。 
代码 清单 16.24 cbe 专用 的 alloca 函数 (lib/alloca.s) 


text 
.globl alloca 
.type alloca,eGfunction 


alloca: 
popl %ecx 
movil (S$esp), $eax 
addl $3, $eax 
andl $-4, teax 
subl $eax, %esp 
leal 4 (%esp), $eax 
jmp *%ecx 


.size alloca, .-alloca 


如 上 所 示 ， 这 是 汇编 语言 。 因 为 要 直接 操作 栈 指针 ， 所 以 没有 办 法 用 Cb 语言 实现 alloca 
函数 ， 于 是 就 直接 用 汇编 语言 来 写 了 。 

首先 执行 pop1 指令 ， 把 返回 地 址 存 和 ecx 寄存 器 ， 同 时 使 得 栈 指针 回 退 4 个 字 节 。 此 时 
esp 寄存 器 指向 alloca 函数 的 第 1 个 参数 ， 于 是 执行 movi 指令 把 第 1 个 参数 取出 到 eax 寄存 
器 中 。 

接着 执行 add1 指令 和 anadl 指令 ， 令 第 1 个 参数 的 值 扩展 为 4 的 倍数 。 这 里 所 说 的 “ 扩 
展 为 4 的 倍数 ” 指 的 是 ， 璧 如 第 1 个 参数 为 0 时 结果 为 0,， 为 1、2、3、4 时 结果 为 4， 为 5、 
6、7、8 时 结果 为 8。x86 上 的 Linux 的 栈 块 大 小 为 4 字 他 ， 因 此 需要 进行 这 个 转换 。 

这 两 个 指令 连 起 来 就 是 C 语言 中 的 (size+3) & 0xFFFFFFFC。 也 就 是 说 ， 加 3 后 最 后 2 
位 归 零 。 最 后 2 位 归 零 的 操作 相当 于 把 整数 变 为 比 其 小 的 最 大 的 4 的 倍数 。 如 果 加 上 3 后 再 进 
行 这 个 操作 ， 得 到 的 则 是 比 〈 正 ) 整数 大 的 最 小 的 4 的 倍数 。 

回 到 alloca 函数 的 实现 。 接 下 来 执行 subl 指令 使 得 esp 寄存 器 的 值 减 去 eax 寄存 器 的 
值 ， 也 就 是 扩展 机 顺 栈 。 

再 接着 ,执行 leal 指令 ,把 esp 加 4 后 的 值 传人 eax 寄存 器 。 这 个 就 是 alloca 函数 的 返 
回 值 。 之 所 以 要 加 4， 是 因为 从 alloca 函数 返回 后 ， 栈 指针 需要 后 退 参 数 大 小 。 由 于 alloca 
函数 返回 的 值 必须 和 alloca 国 数 调用 结束 后 〈 栈 指针 后 退 后 ) 的 esp 一 致 ， 因 此 需要 补足 将 
要 回 退 的 部 分 。 

最 后 执行 jmp 指令 ， 跳 转 到 在 函数 起 始 位 置 处 保存 到 ecx 寄存 需 中 的 返回 地 址 。 因 为 使 用 
ret 指令 时 esp 寄存 带 必 须 指向 返回 地 址 ， 所 以 从 alloca 函数 返回 时 不 能 用 ret 指令 。 





































































































优化 的 方法 


本 章 将 解说 优化 程序 的 方法 及 其 分 类 。 
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什么 是 优化 








本 节 来 讲述 什么 是 优化 。 


各 种 各 样 的 优化 


在 程序 设计 领域 ， 提 到 “优化 ”， 一 般 指 的 是 提高 程序 的 执行 速度 。 不 过 “优化 ”这 个 词 不 
一 定 只 与 执行 速度 相关 。 
举 个 例子 ，GCC 编译 器 有 一 个 选项 -os， 可 以 使 得 生成 的 代码 最 小 。 代 码 最 小 并 不 意味 着 
执行 速度 最 快 ， 不 过 使 代码 量 最 小 化 本 号 也 称 得 上 是 一 种 优化 。 这 样 的 操作 可 以 看 作 是 “和 代 
码 量 相关 的 优化 ”。 除 此 以 外 ,还 有 “与 执行 时 的 内 存 使 用 量 相关 的 优化 ” “程序 响应 速度 相关 
的 优化 ”等 ， 事 实 上 有 各 种 各 样 的 优化 。 

话 虽 如 此 ， 一 般 而 言 最 受 关注 的 还 是 执行 速度 相关 的 优化 。 本 书 中 接 下 来 讲述 的 也 是 执行 
速度 相关 的 优化 。 


[F3 优化 的 案例 
首先 介绍 几 个 最 广为人知 的 优化 方法 ， 如 下 所 示 。 



































e is m 

e 代数 简化 

e 降低 运算 强度 

e 削 除 共同 子 表达 式 
e 消除 无 效 语句 

€ 函数 内 联 


下 面 按 顺 序 来 讲解 。 


常量 折 赤 


3E ETT (constant folding ) 指 的 是 把 常量 表达 式 在 编译 时 进行 运算 。 壁 如 下 面 的 C 语言 代码 。 










































































int max size - 2 * 1024 * 1024; /* 2MB */ 


17.1 什么 是 优化 | 335 











d T UNIT 因此 可 以 在 编译 时 进行 计算 。 如 果 在 编译 时 
了 运算 ， 那 么 程序 运行 时 就 可 以 省 略 这 次 运算 ， 因 此 可 以 获得 更 快 的 执行 速度 。 这 就 是 常 


FJ 代数 简化 
代数 简化 (algebraic simplification ) 指 的 是 利用 表达 式 的 数学 性 质 ， 对 表达 式 进行 简化 。 


比如 x*1 这 个 表达 式 和 x 是 一 样 的 ， 可 以 直接 蔡 换 成 xx。 同样 地 ，x+0、x-0 等 也 可 以 蔡 
换 成 x。 而 xx0 恒 等 于 0， 因 此 也 可 以 直接 用 0 来 代替 。 


降低 运算 强度 
降低 运算 强度 (strength reduction ) 指 的 是 用 更 高 速 的 指令 进行 运算 。 
比如 说 x*2 这 个 表达 式 ， 可 以 转换 成 加 法 运算 x+x。 一 般 来 说 CPU 计算 加 法 比 计算 乘法 
效率 更 高 ， 因 此 虽然 两 个 式 子 效果 相同 ， 但 x+x 的 运算 速度 更 快 。 这 就 是 “降低 运算 强度 ”的 
办 法 。 
把 乘法 转换 成 位 移 运 算 也 是 降低 运算 强度 的 一 个 例子 。 一 般 而 言 ， 求 整数 与 2 的 阶乘 的 乘 
积 可 以 用 位 移 运算 来 优化 。 因 为 x 乘 以 4 和 x 左 移 2 比特 的 效果 是 一 样 的 ， 而 后 者 速度 更 快 。 


削 除 共同 子 表达 式 


削 除 共同 子 表达 式 ( common-subexpression elimination ) 指 的 是 有 重复 运算 的 情况 下 ， 把 多 
次 运算 压缩 为 一 次 运算 的 方法 。 
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PB FIERI C 语言 代码 。 
akole sa c el a la e e EIE 
aloe 7 E3 2) db e SS a db (ene 





对 x 和 yy 的 计算 中 ，axb+c 这 个 部 分 的 运算 是 一 致 的 。 这 种 情况 下 ， 因 为 axb+c 的 值 一 
样 ， 所 以 不 必要 计算 2 次 。 只 要 把 上 述 代码 进行 如 下 转换 ， 这 部 分 就 可 以 只 计算 1 次 。 
aiee elo S eL S lo i ER 


aae Se rn (eo) e dig 
int y - 2 -« tmp; 


这 就 是 削 除 共同 子 表 达 式 。 
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消除 无 效 语句 


消除 无 效 语句 ( dead code elimination ) 指 的 是 删除 从 程序 逻辑 上 执行 不 到 的 指令 。 壁 如 下 
面 的 C 语 言 代 码 毫 无 意义 ， 完 全 可 以 删除 掉 。 














aie (9) q 
fprintf(stderr, "program startedWn"); 
} 


这 样 的 语句 在 调试 用 的 代码 中 很 常见 。 


F3 ERZXPJEX 

函数 内 联 ( function inlining ) 指 的 是 把 (小 的 ) 函数 体 直接 能 入 到 函数 调用 处 ， 使 得 函数 调 
用 的 作用 域 归 零 的 方法 。 

比如 下 面 的 C 语言 代码 。 


























int 
region size(int n block) 


{ 
} 
假设 在 别 的 地 方 通过 zegion_size(2) XAR AHT f KRN, 那么 将 其 蔡 换 成 
2*1024 结果 也 是 一 样 的 。 这 就 是 函数 内 联 。 
不 过 ， 因 为 egion size 是 全 局 作用 域 的 函数 ， 编 译 时 的 优化 仅 限 于 同一 个 文件 中 定义 
的 函数 调用 。 如 果 想 对 程序 中 所 有 的 region size 函数 调用 都 进行 函数 内 联 ， 那 么 链接 时 也 
需要 进行 代码 优化 。 
Ah 2*1024 又 是 只 含 常 量 的 表达 式 ， 因 此 可 以 进一步 用 常量 折 和 县 的 方法 替换 成 2048。 
这 样 组 合 运用 多 种 优化 方法 可 以 获得 更 大 的 优化 效果 。 以 什么 样 的 顺序 组 合 各 种 优化 方法 ， 从 
而 获取 更 好 的 优化 效果 ， 也 是 非常 关键 的 一 点 。 


return n block * 1024; 
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优化 的 分 类 








本 市 介绍 优化 的 分 类 。 


基于 方法 的 优化 分 类 


这 里 从 3 个 不 同 的 视角 来 对 优化 进行 分 类 。 

第 1 个 视角 是 根据 优化 方法 来 分 类 。 可 以 使 得 程序 更 快运 作 的 方法 大 致 可 以 分 为 以 下 3 类 。 

1. 减少 执行 的 指令 数 

2. 使 用 更 快速 的 指令 

3. 并 行 地 执行 指令 

第 1 种 方法 是 通过 减少 所 要 执行 的 指令 数目 来 提高 执行 速度 。 辟 如 党 
预先 执行 一 些 指令 ， 从 而 减少 最 终 执行 的 指令 数 的 方法 。 

第 2 种 方法 指 的 是 尽量 选用 更 高 效 的 指令 来 完成 同一 个 日 标 。 壁 如 把 乘法 运算 转换 成 位 移 
运算 的 “降低 运算 强度 ”方法 就 属于 这 个 分 类 。 

另外， 现在 的 计算 机 里 ， 相 比 内 存 的 访问 速度 而 言 ， 寄 存 占 的 访问 速度 有 压倒 性 的 优势 。 
因此 ， 尽 可 能 地 使 用 不 访问 内 存 的 指令 ， 也 可 以 提升 速度 。 这 也 是 使 用 更 快速 的 指令 的 一 种 
体现 。 

第 3 种 就 是 物理 上 同时 执行 多 条 指令 的 方法 。 璧 如 下 面 的 C 语言 代码 。 









































折 县 就 是 在 编译 时 


Lan 
























































dnt ox e m * bs: 
see 3? e € * gm 





在 这 个 场景 里 ，a*b 和 cx*d 在 计算 的 时 候 不 存在 任何 依赖 关系 ， 因 此 同时 执行 也 不 会 有 
影响 。 这 就 是 “并 行 执行 指令 ”的 想法 。 像 使 用 x86 中 的 SSE 这 样 可 以 并 行 执行 多 个 运算 的 指 
令 、 使 用 线程 等 都 属于 这 一 类 方法 。 

当然 ， 这 3 种 方法 也 可 以 共用 ,并 且 共 用 的 优化 效果 更 值得 期 待 。 


[J 基于 作用 范围 的 优化 分 类 
接 下 来 看 看 基于 作用 范围 的 优化 分 类 。 根 据 作用 范围 的 不 同 ， 通 常 可 分 为 以 下 2 种 优化 方法 。 
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1. 专注 优化 程序 的 某 一 部 分 的 方法 

2. 对 程序 全 局 进行 解析 优化 的 方法 

第 1 种 是 只 关注 某 个 表达 式 或 者 语句 ， 在 非常 小 的 范围 内 进行 优化 的 方法 。 这 样 的 优化 方 
法 称 为 局 部 优化 (local optimization )。 其 中 ， 针 对 一 部 分 机 需 码 的 指令 进行 优化 的 方法 叫 作 宕 
视 孔 优化 ( peep-hole optimization )。 前 文中 提 到 的 将 乘法 运算 转换 成 位 移 运算 的 优化 也 算是 一 
Tisi UA LUCA. 

第 2 种 指 的 是 至 少 以 函数 为 单位 的 优化 方法 。 这 样 的 方法 一 般 称 为 全 局 优化 (global 
optimization )。 了 天数 内 联 就 是 全 局 优化 的 一 个 例子 。 

局 部 优化 和 全 局 优化 相 较 而 言 ， 当 然 是 局 部 优化 更 为 简单 。 不 过 局 部 优化 虽然 简单 ， 有 时 
候 得 到 的 优化 效果 却 相当 不 错 ， 所 以 是 非常 “实惠 ”的 优化 方法 。 


FI 基于 作用 阶段 的 优化 分 类 
最 后 介绍 基于 作用 阶段 的 优化 分 类 。 一 般 的 编译 器 可 以 在 以 下 几 个 时 间 节 点 上 进行 优化 。 
















































































语义 分 析 后 ( 针对 抽象 语法 树 的 优化 
. 生成 中 间 代 码 后 ( 针对 中 间 代 码 的 优化 ) 
.生成 汇编 代码 后 ( 针对 汇编 代码 的 优化 ) 
链接 后 ( 针对 程序 整体 的 优化 ) 
通常 来 说 ， 越 里 进行 ， 越 能 针对 编程 语言 的 结构 、 语 义 等 进行 优化 。 璧 如 在 抽象 语法 树 阶 
段 ， 我 们 能 简单 地 识别 循环 ， 因 此 在 这 个 阶段 能 针对 循环 体 进 行 优化 。 

在 中 间 代 码 阶 段 可 以 进行 语言 无 关 的 优化 。 该 阶段 可 以 使 用 从 局 部 优化 到 全 局 优化 的 多 种 
优化 方法 。 此 外 ， 有 时 候 还 会 根据 情况 把 一 段 中 间 代 码 拆散 ， 令 其 更 容易 进行 优化 。 

一 旦 编译 成 了 汇编 代码 ， 就 很 难 对 代码 进行 大 范围 的 优化 了 。 这 个 阶段 的 优化 基本 上 集中 
在 蜂 视 孔 优化 这 种 方式 上 。 

最 后 ， 链 接 后 也 可 进行 优化 。 链 接 后 构成 程序 主体 的 各 个 处 理 流程 ( 函数 ) 已 经 固定 ， 可 
以 对 程序 整体 进行 大 范围 的 解析 优化 。 最 近 不 少 商 用 的 编译 器 ， 壁 如 Microsoft 的 Visual Studio, 
Intel C Compiler(icc) 等 都 具备 程序 链接 时 的 优化 功能 。 
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cbc 中 的 优化 








本 节 来 讲解 cbe 中 应 用 的 优化 方法 。 


cbc 中 的 优化 原则 


相对 于 优化 程序 ， 本 书 中 更 重视 展现 程序 运行 的 环境 以 及 运作 机 制 等 ， 因 此 只 进行 了 最 简 
单 的 优化 ， 包 括 “代数 优化 ”和 “降低 运算 强度 ”这 两 种 。 

cbe 的 中 间 代 码 中 有 相当 一 部 分 无 用 的 和 常量， 如 果 进 行 常量 折 欠 ,优化 效果 应 该 不 错 。 不 过 
由 于 篇 幅 所 限 ， 没 有 具体 实现 。 这 部 分 就 留 给 读者 作为 课题 来 完成 好 了 o 


cbc 中 实现 的 优化 
cbc 中 实现 了 如 下 优化 。 


























.将 mov $0, reg 转换 成 xor reg, reg 

数 1 或 者 -1 的 加 法 运算 转化 成 inc 或 者 dec 指令 
与 立即 数 0 的 加 法 或 者 减法 运算 

数 1 或 者 -1 的 减法 运算 转化 成 dec 或 者 inc 指令 
数 0 的 乘法 运算 转化 成 0 的 赋值 操作 

直接 删除 与 立即 数 1 的 乘法 运算 

和 与 立即 数 2、4、8、16 的 乘法 运算 转化 成 位 移 指令 
直接 删除 跳 转 到 紧 接 着 的 标签 的 指令 


这 些 优化 都 可 以 通过 1 到 2 条 指令 简单 地 实现 ， 并 且 这 些 优化 都 可 以 复 用 在 所 有 场合 中 。 


cbc 中 优化 的 实现 


下 面 简要 讲解 cbc 中 的 优化 。 本 书 中 关于 优化 的 话题 都 不 会 深入 细节 。 

可 以 看 到 上 述 前 7 条 优化 都 可 以 通过 这 两 个 部 分 进行 描述 :“ 适 用 优化 的 Instruction 对 
象 的 模式 ”和 “匹配 到 这 种 模式 时 所 做 的 变换 ”。 

比如 把 加 1 指令 变换 成 inc 指令 的 情况 ， 就 是 搜索 符合 “adq S1, 寄存 器 ”这 种 模式 
的 Instruction 对 象 ， 匹 配 后 变换 成 “inc FAR” MIAT., cbe 把 这 两 个 步骤 封装 到 
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SingleInsnFilter 对 象 中 来 表示 ， 如 代码 清单 17.1 所 示 。 
代码 清单 17.1 用 SinglelnsnFilter 封装 的 变换 模式 (sysdep/x86/PeepholeOptimizer.java) 


set.add(new SingleInsnFilter( 
new InsnPattern("add", imm(1), reg()), 
new InsnTransform() { 
public Instruction apply(Instruction insn) ( 
return insn.build("inc", insn.operand2()); 


) 


)); 





InsnPattern 对 象 表示 指令 的 模式 ， 而 实现 了 InsnTransform 接口 的 对 象 进行 具体 的 
变换 操作 。 变 换 的 规则 通过 这 种 形式 统一 进行 记述 ， 之 后 会 对 每 一 个 Instruction 对 象 进行 
匹配 ， 并 应 用 变换 。 
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更 深层 的 优化 








cbe 中 基本 上 没有 进行 深入 的 优化 ， 那 么 如 有 果 要 进行 更 深层 次 的 优化 ， 需 要 从 哪些 方面 入手 
呢 ? 本 节 中 主要 讲解 实行 深层 优化 的 操作 步骤 。 


基于 模式 匹配 选择 指令 

首先 来 考虑 实现 成 本 低 、 影 响 代 码 范 于 小 的 优化 。 

首先 ， 中 间 代 码 中 细 到 某 个 Stmt 对 象 这 个 粒度 上 也 还 有 可 优化 的 余地 。cbc 基本 上 每 次 只 
考察 1 个 Expr 对 象 ， 并 生成 指令 ， 而 通过 考虑 更 大 范围 的 基于 模式 匹配 选择 指令 (instruction 
selection by pattern matching )， 则 能 生成 更 加 快速 的 指令 。 

比如 在 生成 如 图 17.1 ARAP ERIT, Mem, Bin, Int 这 3 个 中 间 代 码 节点 其 实 可 以 
合 在 一 起 变换 成 1 个 mov 指令 。 











movl -8(96ebp), 96eax 
movl 4(%eax), 96eax 





式 匹 配 选 择 指令 
更 普遍 地 说 ， 就 是 把 中 间 代 码 的 树 ， 依 据 预 完 定义 的 节点 的 模式 进行 分 割 ， 从 而 生成 指令 。 
这 就 是 基于 模式 匹配 选择 指令 的 方法 。 第 15 章 中 介绍 的 Assign 节点 的 编译 步 又 中 ， 对 其 中 一 
边 是 常量 的 情况 进行 了 特别 处 理 ， 这 也 是 基于 模式 匹配 选择 指令 的 一 种 。 

一 般 来 说 ， 对 树 进行 分 割 时 ， 应 用 的 模式 越 大 ， 最 后 得 到 的 代码 效率 越 高 。 辟 如 图 17.1 的 
例子 中 ， 和 分 割 成 Mem、Bin、Var、Int 这 4 个 节点 相 比 , 把 Mem、Bin、Int 这 3 个 节点 


合并 生成 的 代码 速度 更 快 。 
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分 配 寄存 器 

其 次 ， 用 好 寄存 器 也 是 一 个 非常 重要 的 优化 方法 。 为 用 好 寄存 器 ， 尽 量 减 少 内 存 访问 ， 就 
需要 给 局 部 变量 、 临 时 变量 分 配 寄存 器 。 为 变量 分 配 寄存 器 的 操作 称 为 分 配 寄存 器 (register 
allocation )。 

分 配 寄存 器 的 问题 在 于 ， 比 起 变量 而 言 ， 寄 存 器 的 数目 太 少 了 。 为 了 充分 利用 数目 不 多 的 
寄存 带 ， 就 必须 灵活 地 在 不 同 变量 之 间 重 复 利 用 寄存 带 。 为 此 ， 必 须 确认 某 个 寄存 带 是 否 会 被 
2 个 变量 同时 使 用 。 换 个 说 法 ， 也 就 是 需要 判断 是 否 会 有 2 个 变量 同时 “活着 ”。 

壁 如 下 面 的 C 语 言 代 码 ，i 和 x，i 和 y 都 同时 被 使 用 (活着 )。 不 过 x 和 y 同时 被 使 用 的 
可 能 性 不 大 ， 也 就 是 说 ，x 和 y 这 2 个 变量 可 以 共用 1 个 寄存 器 。 
































dmt le Ea 
EO (Gh e s SX oc 439g 3o) qd 
ar (uox: 
int x = i + 5; 
Ici e E T 


) 


else { 
dme y? coa € E) own dig 
Lc NM 
} 
} 


像 这 样 分 析 变 量 性 质 的 方法 ， 称 为 变量 的 活跃 度 分 析 (liveness analysis )。 
分 析 变 量 的 活跃 度 ， 主 要 是 为 了 判定 该 变量 是 否 可 以 分 配 同一 个 寄存 器 。 在 此 基础 上 ， 一 
般 会 使 用 一 种 被 称 为 图 形 着 色 (graph coloring ) 的 算法 来 分 配 寄存 器 。 


P 控制 流 分 析 
为 分 析 变 量 的 活跃 度 ， 需 要 分 析 程 序 代 码 的 流程 。 这 种 分 析 称 为 控制 流 分 析 (control flow 


analysis )。 

此 外 ， 为 分 析 程 序 代码 的 流程 ， 一 般 会 使 用 比 语句 更 大 的 基本 代码 块 (basic block ) 作为 
单位 对 象 。 所 谓 基 本 代码 块 ， 指 的 是 不 会 中 途 发 生 跳 转 ， 也 不 会 从 其 他 代码 跳 转 过 来 的 代码 块 。 
比如 说 ， 上 述 代 码 中 if 语句 后 的 then 部 分 和 else 部 分 都 可 以 算 作 基本 代码 块 。 


F 大 规模 的 数据 流 分 析 和 SSA 形式 

为 了 对 单个 函数 整体 或 者 对 多 个 函数 进行 优化 ， 需 要 对 代码 的 整体 数据 流 进行 分 析 。 所 谓 
数据 流 ， 指 的 是 “这 个 表达 式 中 计算 的 值 在 哪里 被 使 用 了 ”这 样 的 信息 。 变 量 的 活跃 度 分 析 也 
是 数据 流 分 析 的 一 种 。 
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一 般 会 使 用 SSA 形式 ( static single assignment form ) 这 种 中 间 代 码 形式 进行 超越 了 基本 代 
码 块 范围 的 数据 流 分 析 。GCC 的 第 4 个 版 本 使 用 的 也 是 SSA 形式 的 中 间 代 码 。 

SSA 形式 指 的 是 ， 为 了 使 每 一 个 变量 只 会 被 赋值 ( 初始 化 ) 一 次 ， 而 为 变量 起 一 个 别名 ， 
并 将 变量 变形 。 壁 如 下 面 的 C 语言 程序 中 ,，i 被 多 次 赋值 。 











ae ah m 9s 98 5p 
i 4s 6; 
i *= 2; 


把 这 个 程序 转化 成 SSA 形式 的 话 ， 会 得 到 下 面 的 代码 。 


zügig 3H0) m xx c 5 
isti iO + 6; 
ia aLi Ea eip 


SSA 形式 的 好 处 在 于 变量 的 值 非常 明确 ， 中 途 不 会 发 生变 化 。 壁 如 上 述 代 码 中 变量 io 的 
值 自始至终 者 是 x*5。 采 用 SSA 形式 的 话 ， 数 据 流 分 析 将 会 非常 快速 ， 并 且 占 用 内 存 很 少 。 另 
外 ,使 用 SSA 形式 的 话 ， 每 个 语句 乃至 整个 程序 都 可 以 用 同样 的 算法 进行 优化 ， 这 也 是 非常 大 
的 优点 。 














Press 


nN-B 





cbe 还 留 有 很 大 的 优化 空间 。 本 书 中 没有 深入 讨论 优化 相关 的 话题 ， 如 果 读 者 希望 进一步 学 
习 ， 可 以 参考 第 22 章 中 列举 的 图 书 等 ， 挑 战 一 下 更 深层 次 的 优化 。 
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本 章 将 详细 讲解 汇编 文件 相关 的 剩余 部 分 的 内 
容 ， 以 及 利用 GNU as 生成 目标 文件 的 机 制 。 
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ELF 文件 的 结构 








本 厄 中 将 简要 介绍 ELF 文件 的 结构 。 


F ELF 的 目的 


Linux 使 用 ELF 作为 目标 文件 的 格式 。 从 前 Linux 中 目标 文件 以 aout 格式 为 主 ， 不 过 由 于 aout 
格式 不 能 很 好 地 支持 动态 链接 以 及 C++， 因 此 其 主流 地 位 逐渐 被 ELF 格式 所 取代 ， 直 到 现在 。 

ELF 格式 被 用 于 描述 目标 文件 、 可 执行 文件 以 及 共享 库 的 所 有 信息 。 无 论 在 什么 场合 ， 使 
用 ELF 格式 的 目的 只 有 一 个 ， 那 就 是 把 机 器 代码 及 其 对 应 的 元 数据 以 方便 链接 需 和 加 载 器 处 理 
的 形式 保存 起 来 。 

代码 的 元 数据 指 的 是 如 下 的 信息 。 

1. 代码 文件 的 大 小 以 及 转换 前 的 源 代码 文件 名 

2. 符号 

3. 重 定位 信息 

4. 调试 信息 

第 1 点 和 第 4 点 相对 直观 简单 ， 这 里 来 看 看 第 2 点 和 第 3 点 相关 的 内 容 。 

符号 (symbol) 指 的 是 变量 或 者 函数 的 名 称 。 简 单 的 情况 下 直接 使 用 原 编程 语言 中 的 函数 
名 或 者 变量 名 即 可 ， 有 时 候 也 会 根据 不 同 的 编程 语言 进行 特定 的 变换 后 得 到 符号 名 称 。 这 种 变 
换 称 为 名 称 重 整 ( name mangling )。 

譬如 C++ 就 是 需要 进行 名 称 重 整 的 编程 语言 之 一 。 用 C++ 写 一 个 原型 ， 定 义 形 如 static 
int foo(int st) 的 函数 ， 用 gcc 编译 后 ,在 目标 文件 中 就 可 以 看 到 这 个 函数 被 表示 为 
_Z3fooi。 因 为 C++ 中 可 以 定义 函数 名 相同 但 参数 类 型 不 同 的 函数 ， 所 以 这 种 变形 是 必要 的 。 

而 重 定位 (relocation ) 信息 用 于 表示 在 链接 完成 前 无 法 确定 内 存 地 址 的 代码 位 置信 息 。 如 
上 一 章 中 所 述 ， 如 果 是 同一 个 文件 中 定义 的 函数 ， 那 么 可 以 在 汇编 阶段 就 确定 访问 内 存 地 址 的 
代码 〈 内 存 引用 )。 不 过 ， 如 果 是 共享 库 内 的 函数 ， 那 么 在 最 终 链接 完成 后 才能 确定 其 内 存 地 
址 。 在 这 种 情况 下 ， 目 标 文件 中 就 会 留 有 “代码 中 这 个 位 置 的 内 存 引用 尚未 确定 ”这 样 的 信息 。 
这 样 的 信息 就 是 重 定位 信息 。 

ELF 文件 中 就 包含 上 述 内 容 。 
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F3 ELF 的 节 和 有 段 
为 了 兼顾 链接 器 、 汇 编 器 等 编译 工具 以 及 把 程 


序 加 载 到 内 存 中 的 加 载 器 两 者 的 易 用 性 需求 ，ELF 程序 头 
文件 的 结构 正在 逐步 转变 成 二 元 结构 。 ( 描述 段 ) Pn 
下 面 详细 讲解 二 元 结构 。 图 18.1 中 粗略 地 表 
m T ELF 文件 的 构造 。 如 果 以 程序 头 (program .rodata 节 T. 
header ) 信息 来 处 理 ， 则 ELF 文件 可 以 解释 成 段 集 
合 ; 如 果 以 节 头 〈section header ) 信息 来 处 理 ， 则 可 
以 解释 成 节 集 合 。 m 
节 (section) 是 汇编 器 、 链 接 器 等 处 理 ELF X 
件 内 容 的 单位 。ELEF 文件 把 不 同 目的 的 代码 、 数 据 
等 分 割 成 节 保存 。 璧 如 机 器 码 统一 保存 到 .text 节 ib 
中 ， 全 局 变量 的 初始 化 数据 则 保存 在 .data 节 中 。 图 18.1 ELF 文件 结 
E (segment ) 则 是 把 程序 加 载 到 内 存 的 加 载 器 处 理 ELF 文件 时 的 单位 。 段 由 1 个 以 上 的 节 
构成 。 内 存 上 不 同 范围 有 着 “只 读 ”"”“ 可 写 ”*”“ 可 执行 ”等 不 同属 性 ， 因 而 需要 根据 属性 进行 分 
段 。 璧 如 机 器 码 如 果 不 可 执行 就 毫 无 意义 ， 因 此 要 统一 到 具有 可 执行 属性 的 段 中 。 
段 相关 的 内 容 将 在 第 20 章 详 述 ， 本 章 先 细 看 节 相关 的 内 容 。 


目标 文件 的 主要 ELF Ë 


ELF 目标 文件 中 的 主要 节 如 表 18.1 所 示 。 
表 18.1 目标 文件 的 主要 ELF 节 

































































































































































































































































































































































节 名 内 容 

.text 机 器 码 

.data 全 局 变量 等 。 在 文件 中 无 大 小 信息 

.rodata 读 入 专用 的 .data 

.bss 通用 符号 ( 后 述 ) 等 。 在 文件 中 无 大 小 信息 
.rel.text .text 段 中 的 符号 的 重 定位 信息 

.symtab 文件 中 包含 的 符号 表 。 实 际 的 字面 量 在 .strtab 节 中 保存 
.strtab 符号 等 字符 串 列表 

.shstrtab 节 名 字符 串 列表 

.init 标 文件 加 载 时 执行 的 代码 

init array 标 文 件 加 载 时 执行 的 函数 的 指针 数组 

fini 进程 结束 前 执行 的 代码 

fini array 进程 结束 前 执行 的 函数 的 指针 数组 

.note 于 保障 兼容 性 竺 

.debug 调试 用 的 符号 信息 

line 代码 和 原始 代码 的 行 号 对 照 
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ELF 节 多 种 多 样 ， 并 且 有 很 多 是 链接 器 生成 的 ， 这 里 只 讨论 汇编 器 明确 处 理 的 节 。cbc 生成 
的 ELF 文件 只 有 以 下 4 个 节 。 
..text 节 


. .data 节 


. .rodata 节 


AOUN 一 


.bss 节 


下 面 按 顺 序 讲 解 每 个 节 的 用 途 。 

首先 text 节 是 配置 机 器 码 的 节 。 虽 然 节 名 叫 text， 但 和 文本 文件 没有 关系 。 

data 节 配 置 的 是 拥有 初始 值 的 全 局 变量 等 。 这 个 节 的 数据 在 加 载 后 有 可 能 发 生变 更 。 

.rodata 节 配 置 的 是 字符 串 字 面 量 等 不 能 更 新 的 数据 。rodata 就 是 Read Only DATA 的 缩写 。 

最 后 ，.bss 节 配 置 的 是 没有 初始 值 的 全 局 变量 等 。 这 个 节 在 ELF 文件 中 没有 大 小 信息 ， 
并 且 加 载 到 内 存 中 后 ， 会 被 分 配 所 有 字 节 都 初始 化 为 0 的 内 存 空 间 。BSS 是 Block Started by 
Symbol 的 缩写 。 












































CO 
4 
e. BSS 的 由 来 








据 C 语言 的 作者 Dennis Ritchie 所 说 ，BSS 是 IBM 709 型 号 的 计算 机 专用 的 汇编 器 所 使 用 的 
指令 。 当 时 数组 有 两 种 ， 一 种 将 第 一 个 元 素 设 置 在 内 存 地 址 较 小 的 一 方 ， 另 一 种 将 第 一 个 元 素 设 
在 内 存 地 址 较 大 的 一 方 。 因 此 为 数组 申请 内 存 地 址 的 指令 两 种 ， 就 是 BSS ( Block Started by 
Symbol ) 和 BES ( Block Ended by Symbol )。 不 过 现在 BSS 已 经 失 却 了 原本 的 含义 。 



















































































FJ tH readelf 命令 输出 节 头 

使 用 Linux 的 binutils 包 中 包含 的 readelf 命令 可 以 输出 ELF 文件 的 结构 。 

首先 来 看 看 reade1lf 命令 如 何 输出 节 头 信息 。 要 输出 节 头 信息 ， 需 要 给 readelf 命令 指 
定 -S (大 写 $ ) 选项 。 壁 如 下 列 命令 可 以 输出 可 执行 文件 hello 的 节 头 信息 。 








$ readelf -S hello 
There are 21 section headers, starting at offset 0x670: 


Section Headers: 


[Nr] Name Type Addr Off Size ES Flg Lk Inf Al 
[moy] NULL 00000000 000000 000000 00 0 (y (9) 
(IE ee PROGBITS 08048114 000114 000013 00 A 0 (y 3b 
[ 2] .note.ABI-tag NOTE 08048128 000128 000020 00 A 0 0 4 
[nah HASH 08048148 000148 000028 04 A 4 0 4 
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.dynsym 

.dynstr 
.gnu.version 
.gnu.version r 
.rel.dyn 

Enel 

Mimie 

dps 

MESE 

E 

.rodata 

.dynamic 

.got 

-gor plie 

.data 

. comment 

.Shstrtab 

Key to Flags: 

W (write), A (alloc), X 
(info), L (link order 





O '00 -10 Ui RUN eE O w'00 -1 0) Ul u^ 





N 





O (extra OS processing required) o (OS specific), 


DYNSYM 
STRTAB 
VERSYM 
VERNEED 
REL 

REL 
PROGBITS 
PROGBITS 
PROGBITS 
PROGBITS 
PROGBITS 
DYNAMIC 
PROGBITS 
PROGBITS 
PROGBITS 
PROGBITS 
STRTAB 














(execute), M 
PEG nsu) 


08048170 000170 
080481c0 0001c0 
0804820c 00020c 
08048218 000218 
08048238 000238 
08048240 000240 
08048258 000258 
08048268 000268 
080482b0 0002b0 
080483c8 0003c8 
080483e0 000360 
080493f8 0003f8 
080494c0 0004c0 
080494c4 0004c4 
080494dc 0004dc 
00000000 000460 
00000000 0005c8 


(merge), S 
x (unknown) 





(strings) 


000050 10 
00004c 00 
00000a 02 
000020 00 
000008 08 
000018 08 
00000d 00 
000040 04 
000118 00 
000017 00 
000017 00 
0000c8 08 
000004 04 
000018 04 
000004 00 
0000e8 00 
0000a5 00 





5 5 5 5 D E E E E DPPPPP 
cNoONOSOSOSOUIMcIc MOSS MEOS on 


1 4 
Ql 
ONE? 
1 4 
0 4 
11 4 
0 4 
0 4 
0 16 
0 4 
0 4 
0 4 
0 4 
0 4 
0 4 
DES 
Ql 


p (processor specific) 


readelf -Ss 命令 的 输出 中 ,每 1 行 是 1 个 节 的 信息 。 从 这 个 输出 上 看 ，he1l1o 文件 中 


有 .interp、.note.ABI- 





tag、.hash 等 


2444. 


使 用 readelf 命令 输出 程序 头 





下 面 看 看 程序 头 的 输出 。reade1lf 命令 加 上 -13 
今 可 以 查看 hello 的 程序 头 。 











$ readelf -1 hello 


Elf file type is EXEC (Executable file) 


Entry point 0x80482b0 


There are 7 program headers, 


Program Headers: 





starting at offset 


Type Offset VirtAddr PhysAddr 
PHDR 0x000034 0x08048034 0x08048034 
INTERP 0x000114 0x08048114 0x08048114 
[Requesting program interpreter: /lib/ld- 
LOAD 0x000000 0x08048000 0x08048000 
LOAD 0x0003£8 0x080493f8 0x080493f8 
DYNAMIC 0x0003£8 0x080493f8 0x080493f8 
NOTE 0x000128 0x08048128 0x08048128 
GNU STACK 0x000000 0x00000000 0x00000000 


Section to Segment mapping: 


Segment Sections... 
00 


选项 后 可 以 输出 程序 关 。 壁 如 执行 如 下 命 


FileSiz 
0x000e0 
0x00013 


linux.so. 


0x003£f7 
0x000e68 
0x000c8 
0x00020 
0x00000 


MemSiz 
0x000e0 
0x00013 
2] 
0x003f7 
0x000e8 
0x000c8 
0x00020 
0x00000 





Align 
0x4 
0x1 


0x1000 
0x1000 
0x4 
0x4 
0x4 
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01 .interp 

02 .interp .note.ABI-tag .hash .dynsym .dynstr .gnu.version .gnu. 
MASTER 三 

03 .dynamic .got .got.plt .data 

04 .dynamic 

05 .note.ABI-tag 

06 





Program Headers: 行 后 就 是 段 信 息 。 除 去 [Requesting program interpreter: 
/lib/ld-linux.so.2] 以 外 ,每 1 行 表示 1 个 段 。 从 上 面 的 输出 可 以 看 到 ， 共 有 从 Type 为 
PHDR 的 段 到 GNU. STACK 的 段 共 7 个 段 信息 。 

另外 ， 其 下 方 的 section to Segment mapping: 处 ， 输 出 了 各 个 段 对 应 的 节 。 璧 如 
上 述 输出 中 ,01 段 (Type 为 INTERP ) 对 应 .interp 节 ，04 段 ( Type X DYNAMIC) 对 





应 .dynamic 节 。 


使 用 readelf 命令 输出 符号 表 


最 后 看 看 reade1lf 命令 如 何 输出 目标 文件 的 符号 表 ( .symtab 节 )。reade1lf 命令 加 
上 -s 选项 (这 次 是 小 写 s ) 可 以 输出 符号 表 。 壁 如 执行 下 列 命 令 可 以 查看 hel1o.o 的 符号 表 


zm 


Fia 








$ readelf -s hello.o 


Symbol table '.symtab' contains 8 entries: 
































Num: Value Size Type Bind Vis Ndx Name 
0: 00000000 0 NOTYPE LOCAL DEFAULT UND 
1: 00000000 0 FILE LOCAL DEFAULT ABS test/hello.cb 
2: 00000000 0 SECTION LOCAL DEFAULT 1 
3: 00000000 0 SECTION LOCAL DEFAULT 3 
4: 00000000 0 SECTION LOCAL DEFAULT 4 
5: 00000000 0 SECTION LOCAL DEFAULT S 
6: 00000000 23 FUNC GLOBAL DEFAULT 1 main 
7: 00000000 0 NOTYPE GLOBAL DEFAULT UND printf 
从 这 个 输出 可 以 看 到 ，hello.o 文 件 中 共 记 录 了 8 个 符号 。 璧 如 Num 值 为 1 的 符号 代表 


编译 源 代码 的 文件 名 ，Num 值 为 6 的 符号 代表 main 函数 。 

另外 ， 每 个 符号 还 带 有 类 型 、 访 问 权 限 等 附加 信息 。 璧 如 Type 为 FILE 表示 符号 为 文件 
Z, Type X FUNC 则 表示 符号 为 函数 名 等 。Bind 为 LOCAL 表示 该 符号 仅 在 文件 内 部 可 以 访 
H, Bind 为 GLOBAL 则 表示 符号 可 以 在 链接 目标 中 访问 。 


readelf 命令 的 选项 


除去 目前 介绍 过 的 -s、-1l 和 -s 选项 以 外 ，reade1lf 命令 还 有 很 多 其 他 选项 。readelf 
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的 2.17 版 本 中 的 选项 如 表 18.2 所 示 。 


















































































































































































































































































































































表 18.2 readelf 命令 的 选 
别名 完整 选项 含义 
-a --all 输出 常用 信息 ( 与 -hlSsrdnV 效果 相同 ) 
-h --file-header 输出 ELF 文件 头 
-| --program-headers | 输出 程序 头 
--Segments -| 和 --program-headers 的 别名 
-S --Section-headers 输出 节 头 
--Sections -S 和 --section-headers 的 别名 
-g --section-groups 输出 节 组 信息 
-t --section-details 输出 比 -S 更 详细 的 节 信 息 
-e --headers 输出 3 种 头 信息 ( 与 -hlS 效果 一 致 ) 
-S --syms, -symbols | 输出 符号 表 信息 
-n --notes 输出 NOTE 段 和 .note 节 的 内 容 
-r --relocs 输出 .rel 节 的 内 容 ( 重 定位 信息 ) 
-U --unwind 输出 unwind 节 的 内 容 
-d --dynamic 输出 dyn THAR 
-V --version-info 输出 符号 的 版 本 信息 
-A --arch-specific 输出 体系 架构 的 固有 信息 
-D --use-dynamic 输出 符号 信息 时 ， 不 用 .sym 5, mA .dyn 节 的 信息 来 表示 
-X --hex-dumpzN 把 索引 为 N 的 节 以 16 进 制 输出 
-wit] --debug-dumpI-T] 输出 debug 节 的 内 容 。t 是 “liaprmfFsoR” 之 中 的 任意 一 个 TÆ line, info, 
abbrev, pubnames, aranges, macro, frames, frames-interp. str, loc, Ranges 
之 中 的 任意 一 个 ， 用 于 指定 子 节 。t 和 本 可 以 省 略 
-| --histogram 表示 符号 表 内 容 时 ， 显 示 斗 列表 的 长 度 的 直方 医 
-W --wide 输出 时 即使 行 太 长 也 不 换行 显示 
-v --version 输出 readelf 命令 的 版 本 信息 
-H --help 输出 readelf 命令 的 帮助 信息 
无 论 哪 一 个 选项 ， 如 果 该 选项 对 应 的 信息 在 目标 ELF 文件 中 不 存在 ， 则 会 输出 “文件 中 不 





存在 该 项 信息 ”的 提示 。 


什么 是 DWAREF 格式 





在 本 节 的 最 后 ， 








让 我 们 来 谈 一 下 DWARF 相关 的 内 容 。 








DWARF 是 专门 用 于 在 目标 文件 中 录入 调试 信息 


任意 的 目标 文件 格式 共用 ， 不 过 通常 还 是 和 ELF 文件 一 起 使 用 。 
这 个 名 字 的 由 来 据说 是 Debugging With Attributed Record Formats 的 缩写 ， 不 过 在 





DWARF i 


的 格式 ， 其 最 新 版 本 号 为 3。 





它 虽 然 可 以 与 





DWARF 规格 文档 
到 了 ELF 这 个 








P 并 没有 指明 这 一 
名 字 的 影响 。 


点 ， 因 此 不 是 官方 的 说 法 。 不 过 可 以 猜想 





它 的 命名 应 该 受 


使 用 DWAREF 可 以 在 目标 文件 中 记录 如 下 信息 。 
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e 编译 前 源 文件 的 文件 名 

e 机 器 码 和 函数 名 的 对 应 关系 

e 机 器 码 和 源 代码 行 号 的 对 应 关系 
e 变量 的 类 型 和 名 称 

e 类 型 的 名 称 





DWARF 的 信息 一 般 保存 在 “.debug abbrev”“.debug frame” 等 以 “.depug” 开 
头 的 ELF 节 中 。 

本 书 中 对 DWARF 的 解说 仅 止 于 此 ， 如 果 和 希望 进一步 了 解 DWARF， 可 以 到 DWAREF 的 官 
网 了 上 查阅 相关 文档 。 这 些 文档 都 是 英文 ， 其 中 Introduction to the DWARF Debugging Format 这 
个 文档 写 得 相对 比较 通俗 易 懂 。 














(D DWARF 的 官网 :http://dwarfstd.org/。 
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全 局 变量 及 其 在 ELF 文件 中 的 表示 








本 节 中 将 讲解 ELF 文件 表示 不 同 种 类 的 变量 的 方法 。 


分 配给 任意 ELF 节 


要 在 ELF 文件 中 表示 C 语言 (Cb) 的 全 局 变量 ， 需 要 经 过 以 下 2 个 步骤 。 





1. 分 配 变 量 空间 

2. 记录 变量 符号 

首先 讲解 在 ELF 中 分 配 变量 空间 的 方法 。 

GNU as 在 为 任意 ELF 节 分 配 数据 空间 时 ， 会 使 用 .section 指令 (.section directive )。 壁 如 
把 数据 分 配 到 .rodata 节 时 的 代码 如 下 所 示 。 























.Section .rodata 


.String "Hello, World! Wn" 




















这 样 就 把 "Hello， World!WNn" 这 个 字符 串 字 面 量 分 配 到 了 .rodata 节 ， 并 且 使 其 可 以 
通过 .nco 符号 进行 访问 。 
.Section 指令 的 通用 语法 如 下 所 示 。 
.Section 节 名 
这 样 声明 之 后 ， 下 一 个 更 改 对 象 节 的 指令 出 现 之 前 的 所 有 代码 和 数据 就 都 被 保存 到 “ 节 名 ” 
对 应 的 ELF 节 中 。 壁 如 下 述 例 子 中 ， 字 符 串 字面 量 .LC0 和 .LC1 都 被 保存 到 了 .rodata TB. 
.Section .rodata 


Seeing Heop i 





.String "World!Wn" 


分 配给 通用 ELF 5 


另外 ， 对 于 通用 的 节 ， 还 有 声明 节 开 始 的 专用 指令 。 璧 如 声明 .aata 节 开始 时 ， 可 以 
用 .section .data, 也 可 以 用 .data 来 替代 。 表 18.3 中 展示 了 这 样 的 专用 指令 。 
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表 18.3 声明 特定 节 的 专用 指令 





指令 对 应 分 配 的 节 对 应 的 .section 指令 
.text .text .Section .text 
.data .data .Section .data 

















分 配 .bss 节 


分 配 .text 节 和 .data 市 都 有 专用 的 指令 ， 似 乎 为 分 配 .bss 市 指定 一 个 专用 指令 也 不 
错 。 不 过 事实 上 并 没有 .bss 这 个 指令 。 

.bss 节 只 有 在 运行 时 才 会 有 数据 (也 就 是 说 ， 编 译 时 没有 数据 )， 因 此 不 是 编译 时 分 配 数 
据 ， 而 是 预 留 运行 时 的 内 存 空间 。 

而 预 留 内 存 空间 需要 使 用 如 下 的 .comm 指令 ( .comm directive )。 























.comm 符号 Xi, ， 对 齐 量 ] 











这 样 在 运行 时 就 可 以 分 配 到 “大 小 ”个 字 节 的 内 存 空 间 ， 并 且 可 以 通过 “符号 ”来 访问 这 
个 内 存 范围 了 。 男 外 ， 这 个 内 存 空间 会 按照 “对 齐 量 ”个 字 节 来 对 齐 。 综 上 ，. comm 指令 需要 
同时 指定 符号 、 大 小 和 对 齐 量 。 

.comm 指令 的 用 例如 下 所 示 。 




















.comm gvar, 4, 4 














执行 上 述 命令 可 以 得 到 以 4 字 节 对 齐 的 4 字 节 的 内 存 空间 ， 并 且 可 以 通过 符号 gvar 进行 
访问 。 至 于 这 个 内 存 空间 会 保存 int 类 型 还 是 unsigned long 类 型 的 数据 ， 要 根据 编译 器 生 
成 的 具体 代码 而 定 。 


通用 符号 

为 什么 分 配 BSS 段 的 指令 会 是 .comm é? . comm 指令 的 comm 是 common symbol 的 缩 
写 ， 原 本 是 定义 通用 符号 (common symbol ) 的 指令 。 

通用 符号 和 一 般 的 符号 不 同 ， 可 以 多 次 定义 同一 个 名 称 的 符号 。 并 且 ， 无 论 定义 了 多 少 次 ， 
在 最 终 的 目标 文件 中 同样 名 称 的 符号 都 只 会 留 下 1 个 。 

C 语言 或 者 Cb 中 ， 定 义 时 指定 了 初始 值 的 全 局 变量 就 是 一 般 的 符号 ， 而 没有 指定 初始 值 的 
全 局 变量 则 是 通用 符号 。 也 就 是 说 ， 不 指定 初始 值 的 全 局 变量 可 以 多 次 重复 定义 。 
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假设 存在 main.c 和 1ib.c 这 2 个 文件 , 文件 内 容 如 代码 清单 18.1 和 代码 清单 18.2 PARo v 
代码 清单 18.1 main.c 


#include <stdio.h> 


int i; 


void set i(int n); 


int 
main(int argc, char **argv) 


set i(7); 
printf("i-$dWNn", i); 
return 0; 


} 
代码 清单 18.2 lib.c 
int i; 


void 
set i(int n) 





这 个 程序 通过 下 列 命 令 可 以 成 功 编译 ， 不 会 抛 出 “符号 i 重复 定义 ”这 样 的 错误 。 


gcc -Wall main.c -o main.o 
gcc -Wall lib.c -o lib.o 
gcc main.o lib.o -o main 
ls 

ioe macie Tad 


L2 Xr oX Nro Ur 


编译 完成 后 ， 运 行 可 执行 文件 main 可 以 输出 i 的 值 7。 








也 就 是 说 ，main.c 中 定义 的 变量 和 1ib.c 中 定义 的 变量 i 是 同一 个 变量 。 这 就 是 通用 


另外 ， 如 果 main.c 和 1ib.c 中 某 一 个 文件 对 变量 进行 了 初始 化 ,那么 这 个 变量 就 会 变 成 
一 般 符号 ， 而 另 一 个 则 是 通用 符号 。 这 个 时 候 ， 通 用 符号 会 被 一 般 符 号 同化 而 消失 。 换 名 话说 ， 
这 时 通用 符号 的 定义 和 extern int i 的 作用 基本 一 致 。 

最 后 需要 注意 这 一 点 。 如 果 两 者 都 对 同一 个 全 局 变量 进行 了 初始 化 ,那么 两 个 都 会 变 成 一 
































(D 作者 所 用 的 gcc 版 本 可 能 非常 低 ， 使 用 新 版 的 gcc 对 示例 代码 进行 编译 会 抛 错 。 新 版 的 gcc 对 全 局 变 
量 重复 定义 作 了 限制 。 译 者 注 
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般 符 号 ， 从 而 在 链接 时 会 抛 出 如 下 错误 。 


$ gcc -Wall -c main.c -o main.o 

$ gcc -Wall -c lib.c -o lib.o 

$ gcc main.o lib.o -o main 

lib.o:(.data«0x0): multiple definition of "^i' 
main.o:(.data«0x0): first defined here 
collect2: ld returned 1 exit status 


即便 两 者 的 初始 值 一 致 ， 执 行 结果 也 是 如 此 。 链 接 后 的 整个 目标 文件 中 ，1 个 全 局 变量 的 
初始 化 只 能 进行 1 次 。 


记录 全 局 变量 对 应 的 符号 


接 下 来 讲解 有 初始 值 的 全 局 变量 的 符号 的 定义 方法 。 

在 汇编 语言 中 ， 对 函数 和 变量 设置 标签 后 ， 会 统一 根据 标签 的 符号 录入 .symtab 市 
和 .strtab 节 中 。C 语言 (Cb) 中 不 必 进 行 名称 的 转换 ， 所 以 录入 符号 时 只 需 定义 和 函数 、 
变量 名 一 致 的 标签 即 可 。 

举 个 例子 ， 初 始 值 为 7 大 小 是 4 字 节 的 全 局 变量 gvar 在 汇编 语言 中 可 以 表示 如 下 。 









































.data 
gvar: 
onc 


首先 使 用 .data 指令 声明 以 下 录入 的 值 会 保存 到 .aata 节 中 。 接 着 使 用 . 1ong 指令 , ft 
目标 文件 中 大 小 为 4 字 节 的 内 存 空 间 写 入 7 这 个 字面 量 。 最 后 ， 对 这 个 值 使 用 标签 定义 gvar 
这 个 符号 。 这 样 就 在 .aata 节 上 分 配 了 4 字 节 的 内 存 空间 ， 并 且 设置 其 值 为 7， 通 过 gvar 符 
号 就 可 以 对 这 个 内 存 空 间 进行 访问 。 

另外 ,输出 ELF 文件 时 ， 以 : 工 开头 的 符号 只 在 汇编 句 内 部 使 用 ， 所 以 不 会 输出 到 目标 
文件 的 符号 表格 中 。 因 此 ， 代 码 中 指示 跳 转 目标 的 . no 这 样 的 符号 ， 以 及 用 于 字符 串 常 量 
的 .nLco 这 样 的 符号 在 目标 文件 中 不 会 存在 。 如 果 因 为 调试 需要 等 理由 想 要 输出 这 样 的 符号 ， 
那么 可 以 给 as 指令 添加 - 工 选项 ， 这 样 就 可 以 把 这 些 符 号 输出 到 目标 文件 中 了 。 


记录 符号 的 附加 信息 


符号 的 可 见 性 、 类 型 和 大 小 等 附带 信息 是 可 以 被 指定 的 。 下 面 讲解 相关 的 指定 方法 。 
首先 ， 符 号 的 可 见 性 默认 是 LOCAL， 仅 在 和 希望 指定 为 GLOBAL 时 才 需 要 进行 额外 的 配置 。 
如 果 需 要 把 符号 的 可 见 性 指定 为 GLOBAL， 可 以 通过 .globl 指令 进行 设置 。 



























































.globl global int 
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标 文件 


这 样 global_int 符号 的 可 见 性 就 变 为 了 GLOBAL. 


其 次 ， 使 用 . size 指令 可 以 指定 符号 对 应 的 变量 或 
把 global int 这 个 变量 的 大 小 设置 为 4。 


.sSize global int, 
最 后 ,， 通 


者 函数 的 大 小 。 


BÆ 


SUE PRAO VA 





4 


i 

















过 . type 指令 可 以 指定 符号 对 应 的 变量 或 者 函数 的 
global int 为 变量 ( 而 不 是 函数 )。 


类 型 。 
.type global int, Gobject 





BÆ 


如 下 述 语句 可 以 指定 














类 型 只 


P dal 


Fi 


"Wifi: efunction flleobject. efunction 是 函数 ， 而 eobject 则 是 变 
j 记录 通用 符号 的 附加 信息 


里 


指定 通用 符号 的 附加 信息 的 方法 和 一 般 符 号 稍稍 不 同 。 





I 
首先 ，. comm 15 RARE EK IN. PREIS 
其 次 ，. comm 指令 声 























使用. size 指令 。 
明 的 符号 的 可 见 怕 
要 用 . local 指令 进行 设置 。 下 述 语句 可 以 把 scomm 这 个 通用 
.local scomm 














Zr LI 


Tru 





FE 默认 就 是 GLOBAL ， 仅 在 希望 指定 为 LOCAL 时 才 需 


的 可 见 性 更 改 为 LOCAL. 














通用 符号 的 函数 ， 所 以 通 月 
P3 255 








默认 的 类 


最 后 














， 总 结 一 下 汇编 语言 对 不 同 种 类 的 全 局 变量 的 记述 方法 。 





Eee 


首先 ， 非 static 的 有 初始 值 的 全 局 变量 ( 假设 变量 名 为 gvar ) 定义 如 下 。 
.data 
.globl gvar 


Gobject 
.Size gvar, 4 
gvar: 
long 7 
先 用 .aata 指令 声 
size 指 





节 。 最 后 使 朋 





明 以 下 记述 的 数据 保存 到 .aata 节 。 接 着 使 用 .globl、.type M. 





SEH gvar 符号 的 可 见 性 为 GLOBAL、 指向 的 内 存 空 间 为 OBJECT 并 且 大 小 为 4 字 
日 . Long 指令 在 目标 文件 中 生成 大 小 为 4 的 内 存 空 间 ， 设 置 值 为 7， 并 令 gvar 符 
号 可 以 访问 这 个 内 存 空间 。 
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其 次 ，static 的 有 初始 值 的 全 局 变量 和 静态 局 部 变量 ( 假设 变量 名 为 svar ) 定义 如 下 。 
.data 
.type svar, Gobject 
.Size svar, 4 
Svar: 
.long 7 








先 用 .aata 指令 声明 以 下 记述 的 数据 保存 到 .daca 节 。 接 着 使 用 .type 和 .size 指令 
声明 svar 符号 指向 的 内 存 空间 为 OBJECT 并 且 大 小 为 4 字 节 。 符 号 的 可 见 性 为 默认 值 ， 


由 就 
是 LOCAL。 最 后 使 用 . long 指令 在 目标 文件 中 生成 大 小 为 4 的 内 存 空 间 ， 设 置 值 为 7， 并 且 令 
svar 符号 可 以 访问 这 个 内 存 空间 。 



































HX, dE static 的 没有 初始 值 的 全 局 变量 ( 假设 变量 名 为 csym ) 定义 如 下 。 


.comm csym, 4, 4 





像 这 样 使 用 . comm 指令 声 


H^ Fi 


明 通用 符号 csym。 其 大 小 为 4 字 节 ， 并 且 分 配 内 存 时 以 4 字 节 
对 章 。 





最 后 ，static 的 没有 初始 值 的 全 局 变量 和 静态 的 局 部 变量 ( 假设 变量 名 为 scsym) 定义 
如 下 。 


.local scsym 


.Comm scsym, 4, 4 





先 用 .local 指令 把 通用 符号 scsym 的 可 见 性 改 为 LOCAL。 接 着 使 用 . comm 指令 声明 一 
个 大 小 为 4 并 且 使 用 4 字 节 进行 对 齐 的 通用 符号 scsym。 


下 一 节 讲 解 生 成 以 上 代码 的 cbe 代码 。 
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本 节 中 来 讲解 把 全 局 变量 和 字符 串 常 量 编译 成 汇编 代码 的 cbe 的 代码 。 


generate 方法 的 实现 


我 们 先 回 到 2 章 以 前 ， 从 CodeGenerator 类 的 入 口 函 数 讲 起 。codeGenezrator 类 的 
人 口 函 数 是 generate 方法 。generate 方法 接收 一 个 IR 对 象 ， 返 回 汇编 对 象 ， 如 代码 清单 
18.3 所 示 。 
代码 清单 18.3 generate 方法 ( sysdep/x86/CodeGenerator.java ) 




















public AssemblyCode generate(IR ir) { 
locateSymbols (ir); 
return generateAssemblyCode (ir); 


} 
首先 调用 locateSymbols 方法 ,确定 所 有 的 全 局 变量 、 兄 数 、 字 符 串 常量 的 地 址 和 符号 。 
接着 调用 generateAssemblyCode 方法 ， 开 始 把 IR 编译 成 汇编 代码 。 本 章 的 主题 就 是 
generateAssemblyCode 方法 ， 下 面 就 来 详细 地 看 一 下 。 























generateAssemblyCode 方法 的 实现 


generateAssemblyCode 方法 把 IR 对 象 进 行 编译 ， 转 换 成 Assemblycode 对 象 。 其 实 
现 如 代码 清单 18.4 所 示 。 
代码 清单 18.4 ( sysdep/x86/CodeGenerator.java ) 



































private AssemblyCode generateAssemblyCode (IR ir) { 

AssemblyCode file - newAssemblyCode(); 

file. file(ir.fileName()); 

if (ir.isGlobalVariableDefined()) { 
generateDataSection(file, ir.definedGlobalVariables()); 

} 

if (ir.isStringLiteralDefined()) { 
generateReadOnlyDataSection(file, ir.constantTable()); 

} 

if (ir.isFunctionDefined()) { 
generateTextSection(file, ir.definedFunctions()); 


) 


183 4f 


if (ir.isCommonSymbolDefined()) ( 
generateCommonSymbols(file, ir.definedCommonSymbols ()); 
} 
if (options.isPositionIndependent()) ( 
PICThunk(file, GOTBaseReg()); 
} 
return file; 


) 


译 全 
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首先 调用 newassemblyCode 方法 ， 生 成 保存 汇编 对 象 的 新 的 AssemblyCode 对 象 。 
接着 调用 file 方法， 生成 .file 指令 。.file 指令 用 于 指定 汇编 源 文件 的 文件 名 。 
从 第 3 行 开始 的 4 个 it 语句 分 别 生 成 .data W, .rodata W, .text WHI .bss T. 

各 个 节 对 应 的 对 象 分 别 是 有 初始 值 的 全 局 变量 、 字 符 串 字面 量 、 消 数 和 通用 符号 。 只 要 有 1 个 











以 上 的 对 象 就 会 生成 对 应 的 节 。 下 面 按 顺 序 讲解 4 个 if 语句 内 调用 的 方法 。 


另外 ， 最 后 的 i£ 语句 是 生成 地 址 无 关 代码 时 使 用 的 代码 ， 这 部 分 代码 将 在 第 21 章 详 述 。 


编译 全 局 变量 

















首先 讲解 生成 .data 方 (有 初始 值 的 全 局 变量 ) 的 代码 。 生 成 .data 市 的 


generateDataSection 方法 的 代码 如 代码 清单 18.5 所 示 。 
代码 清单 18.5 generateDataSection 方法 ( sysdep/x86/CodeGenerator.java ) 


private void generateDataSection(AssemblyCode file, 
List«DefinedVariable» gvars) { 
file. data(); 
for (DefinedVariable var : gvars) { 
Symbol sym = globalSymbol(var.symbolString()); 
if (!var.isPrivate()) { 
file. globl(sym); 
) 
file. align(var.alignment()); 
file. type(sym, "Gobject"); 
file. size(sym, var.allocSize()); 
file.label(sym); 


generateImmediate(file, var.type().allocSize(), var.ir()); 


) 


首先 调用 _qata 方 法 ， 生 成 .data 指令 。 
接 下 来 在 foreach 语句 中 对 gvars 进行 遍历 ， 分 别处 理 每 个 变量 。 


先生 成 symbol 对 象 。var .symbolString () 返回 变量 名 对 应 的 符号 的 字符 


tB, pi 








所 述 ， 在 x86 的 Linux 下 ， 变 量 名 和 符号 一 致 ， 因 此 symbolString 方法 直接 返回 变量 名 。 





globalSymbol 方法 生成 一 个 封装 了 该 符号 名 的 字符 串 的 Symbol 对 象 。 
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这 里 为 了 支持 需要 对 变量 名 进行 转换 的 OS 而 进行 了 相当 烦琐 的 处 理 。 如 果 单 纯 考 虑 x86 
的 Linux 的 话 ， 只 需 简 单 地 返回 new NamedSymbol(var.name()) 即 可 。 

接着 ， 如 果 var.isPrivate() X false (也 就 是 说 变量 非 static), WJH globl 
方法 ， 生 成 .globl 指令 。 这 样 符号 的 可 见 性 就 变 为 GLOBAL To 

接 下 来 调用 _align 方 法 ， 生 成 .align 指令 。.align 指令 会 使 接 下 来 的 数据 或 者 代码 
按照 参数 中 指定 数值 倍数 的 字 节 进行 强制 对 齐 。 璧 如 下 列 汇编 代码 会 使 得 .Long 指令 申请 的 内 
存 空间 按照 4 字 节 进行 对 齐 。 














.align 4 
.long 7 


回 到 generateDataSection 方 法 的 代码 。 接 下 来 调用 type 和 size 方法 ， 生 
成 .type 指令 和 .size 指令 。 关 于 这 部 分 代码 的 意义 不 再 蒙 述 。 

接 下 来 调用 label 方法 定义 标签 。 

最 后 调用 generateImmediate 方法 生成 .long 之 类 的 指令 ， 申请 变量 在 目标 文件 中 的 
内 存 空 间 。 接 下 来 会 详细 讲解 这 个 generateImmediate 方法 。 


F 编译 立即 数 


下 面 讲解 生成 申请 变量 内 存 空 间 的 指令 的 generatermmediate 方法， 其 代码 如 代码 清单 
18.6 所 示 。 
代码 清单 18.6 generatelmmediate 方法 ( sysdep/x86/CodeGenerator.java ) 











private void generateImmediate(AssemblyCode file, long size, Expr node) ( 
if (node instanceof Int) ( 
Int expr - (Int)node; 
switch ((int)size) ( 


case 1: file. byte(expr.value()); break; 
case 2: file. value(expr.value()); break; 
case 4: file. long(expr.value()); break; 
case 8: file. quad(expr.value()); break; 


default: 
throw new Error("entry size must be 1,2,4,8"); 


else if (node instanceof Str) ( 


Str expr - (Str)node; 

switch ((int)size) ( 

case 4: file. long(expr.symbol()); break; 
case 8: file. quad(expr.symbol()); break; 
default: 


throw new Error("pointer size must be 4,8"); 


) 
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else { 
throw new Error("unknown literal node type" + node.getClass()); 


) 
) 
首先 根据 参数 node ( 表示 变量 初始 值 的 表达 式 ) 是 Int 还 是 Str 分 为 两 个 处 理 流程 。Int 
类 型 的 话 ， 因 为 是 整数 字面 量 ， 所 以 会 根据 变量 的 大 小 生成 对 应 的 .byte、.value、.1ong 
和 . quad 指令 中 的 一 个 。.pyte 是 1 字 节 ，.value 是 2 字 节 ，.long 是 4 字 节 ，.quad 则 是 8 字 节 。 
例如 初始 值 为 7 的 时 候 就 是 short 类 型 的 变量 ， 则 会 生成 下 述 指令 。 





























.Value 7 


而 参数 node 为 str 对 象 的 时 候 则 是 字符 串 字 面 量 。 在 这 种 情况 下 ， 初 始 值 为 这 个 字符 串 
字面 量 的 地 址 。 也 就 是 说 ， 像 下 述 代 码 一 样 ， 使 用 字符 串 字 面 量 的 标签 。 





"GEOS 
.String "Hello, World! Wn" 
[*oe 略 DOE */ 














.long EEO 4 申请 char* 类 型 变量 msg 的 内 存 空间 。 初 始 值 为 字符 串 .nco 的 地 址 


另外 ，C 语言 中 可 以 像 下 述 代码 一 样 申请 静态 的 拥有 初始 值 的 char 类 型 数组 ,但 Cb 中 则 
不 行 。 因 此 ， 当 参数 node 为 Str 对象 时 ， 变 量 的 类 型 总 是 char*。 























Static char msg[] - "Hello, WorldNin"; 


如 果 Cb 中 也 要 支持 上 述 C 语言 的 数组 初始 化 写法 ,那么 generatermmediate 方法 应 该 
会 复杂 不 少 。 如 果 有 兴趣 ， 可 以 尝试 着 实现 一 下 这 个 特性 。 


编译 通用 符号 


接 下 来 讲解 生成 .bss 节 的 generateCommonsSymbols 方法 。generateCommonSymbols 
方法 的 代码 如 代码 清单 18.7 所 示 。 
代码 清单 18.7 generateCommonSymbols 方法 ( sysdep/x86/CodeGenerator.java ) 





private void generateCommonSymbols (AssemblyCode file, 
List<DefinedVariable> variables) { 
for (DefinedVariable var : variables) { 
Symbol sym = globalSymbol(var.symbolString()); 
if (var.isPrivate()) { 
file. local(sym); 
) 


file. comm(sym, var.allocSize(), var.alignment()); 
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首先 在 foreach 语句 中 对 各 个 变量 进行 过 历 。 像 处 理 全 局 变量 时 一 样 ， 生 成 对 应 各 个 变量 名 
的 Symbol 对 象 。 

接着 ， 如 果 var .isPrivate() 为 真 (也 就 是 static 变量 )， 则 调用 _1ocal 方法 生 
成 .local 指令 ， 把 符号 的 可 见 性 变 为 LOCAL。 

最 后 ， 调 用 _comm 方法 生成 .comm 指令 ， 把 通用 符号 录 和 目标 文件 。 

综 上 ，generateCommonSymbols 方法 会 生成 如 下 汇编 代码 。 























.comm csym, 4, 4 
.local scsym 
.comm scsym, 4, 4 


生成 .bss 节 的 过 程 如 上 所 述 。 这 个 方法 不 涉及 其 他 新 函数 的 调用 ， 逻 辑 相对 简单。 
FJ 编译 字符 串 字面 量 
接 下 来 讲解 生成 .rodata WHJ generateReadOnlyDataSection 方法 。 其 代码 如 代码 


清单 18.8 所 示 。 
代码 清单 18.8 generateReadOnlyDataSection 方法 ( sysdep/x86/CodeGenerator.java ) 








private void generateReadOnlyDataSection(AssemblyCode file, 
ConstantTable constants) [ 
file. section(".rodata"); 
for (ConstantEntry ent : constants) { 
file.label(ent.symbol()); 
file. string(ent.value()); 


) 


首先 调用 section 方法， 生成 .section 指令 ， 把 其 后 的 指令 对 象 替换 成 .rodata 1. 

接着 使 用 foreach 语句 对 参数 constants 进行 遍历 ， 逐 一 处 理 字符 串 字面 量 的 引用 。 

foreach 语句 内 部 使 用 1abel 方法 对 各 个 引用 的 符号 进行 定义 。 这 里 ConstantEntry 类 
的 symbol 方法 会 返回 类 似 .Lco 这 样 的 连续 的 符号 。. DC0 这 样 的 符号 由 locateSymbols 
方法 进行 分 配 。 这 部 分 内 容 将 在 第 21 章 中 详细 讲解 。 

接 下 来 调用 _string 方 法 ， ÆR .string 指令 。. string 指令 把 字符 串 字面 量 保存 到 
目标 文件 中 。 其 用 法 如 下 所 示 。 





.String "Hello, World!Nn" 
.string 指令 的 参数 就 是 字符 串 字 面 量 ， 和 C 语言 一 样 ， 可 以 使 用 形 如 “\n”“\t” 和 
“\077” 的 转 义 序列 。 
Zk E. generateReadOnlyDataSection 方法 会 生成 如 下 汇编 代码 。 
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.Section .rodata 


-ECOS 

.String "Hello, Nor TINAN 
uC: 

Sareerel Male ey 
“2 


.string "World" 


生成 函数 头 


最 后 讲解 生成 .text WHJ generateTextSection 方 法 。generateTextSection 方 
法 的 代码 如 代码 清单 18.9 所 示 。 
代码 清单 18.9 generateTextSection 方法 ( sysdep/x86/CodeGenerator.java ) 





private void generateTextSection(AssemblyCode file, 
List«DefinedFunction» functions) ( 
file. text(); 


for (DefinedFunction func : functions) ( 
Symbol sym - globalSymbol(func.name()); 
if (! func.isPrivate()) { 


file. globl(sym); 
} 
file. type(sym, "efunction"); 
file.label(sym); 
compileFunctionBody(file, func); 
file. size(sym, ".-" + sym.toSource()); 


) 
首先 调用 _text 方 法， 生成 .text 指令 ， 声 明 接 下 来 的 汇编 代码 生成 的 数据 会 保存 


到 .text T. 

接着 使 用 foreach 语句 对 参数 functions 进行 遍历 。 

在 foreach 语句 内 部 ， 首 先 和 人 处 理 全 局 变量 时 一 样 ， 生 成 函数 名 对 应 的 Symbol XA. RAŽ 
也 是 变量 的 一 种 ， 因 此 这 部 分 和 变量 的 处 理 基 本 一 致 。 

接 下 来 ， 如果 func.isPrivate() X true (也 就 是 函数 非 static)， 则 调用 _globl 
方法 ， 生 成 .glob1 指令 ， 把 符号 的 可 见 性 设置 为 GLOBAL。 更 进一步 ,调用 _type 方法 生 
成 .type 指令 ， 把 符号 的 类 型 设置 为 FUNCTION。 最 后 调用 label 方法 定义 与 函数 名 同名 的 
符号 。 

此 后 ， 调 用 compileFunctionBody 方 法 ， 生 成 函数 序言 、 函 数 体 和 函数 尾声 。 这 个 方 
法 已 经 在 第 16 章 中 详 述 过 了 ， 此 处 不 再 展开 。 

最 后 调用 size 方法 ， 生 成 .size 指令 ,设置 函数 的 大 小 。 
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FJ 计算 函数 的 代码 大 小 

.Size 指令 的 第 2 个 参数 使 用 了 一 种 全 新 的 方法 来 计算 函数 的 代码 大 小 。 下 面 就 来 讲解 这 
种 方法 。 

在 generateTextSection 方法 的 最 后 ， 例 如 对 应 main 函数 ， 会 生成 如 下 的 .size 指令 。 






































.Size main, .-main 
请 注意 第 2 个 参数 . -main。 这 其 实 是 汇编 语言 的 减法 运算 表达 式 ， 相 当 于 “.” 的 值 减 去 








main 的 值 。 
“.” 是 一 个 特别 的 符号 ， 表 示 所 在 指令 或 者 命令 前 的 内 存 地 址 。 也 就 是 说 ， 以 上 代码 和 下 
述 在 .size 指令 中 使 用 标签 的 效果 一 致 。 











.L end of main: 
.Size main, .L end of main - main 


generateTextSection 方法 生成 的 代码 中 ，. size 指令 在 函数 代码 结束 处 ， 因 此 “.” 
指向 函数 末尾 的 内 存 地 址 。 该 处 的 内 存 地 址 减 去 main， 也 就 是 函数 main 的 起 始 地 址 ， 就 可 以 
得 到 函数 ma in 的 代码 大 小 。 


FJ zs 


至 此 已 经 编译 了 所 有 函数 ， 申 请 了 所 有 全 局 变量 的 内 存 空间 ， 并 定义 好 了 各 种 符号 。 为 了 
生成 目标 文件 ， 接 下 来 还 必须 确定 访问 全 局 变量 的 内 存 引用 (实现 1ocateSymbols 方法 ) 以 
及 执行 as 命令 进行 编译 了 。 

确定 全 局 变量 内 存 引 用 方面 和 地 址 无 关 代码 关联 紧密 ， 因 此 放 到 第 21 章 详 述 。 最 后 来 看 看 
执行 as 命令 的 代码 ， 本 章 就 告 一 段落 了 。 
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生成 目标 文件 











本 节 中 将 讲解 调用 GNU as 进行 编译 的 过 程 。 


as 命令 调用 的 概要 


cbc 中 单纯 调用 as 命令 对 汇编 文件 进行 编译 。 调 用 as 命令 时 ， 要 指定 输出 文件 名 ， 可 以 
附 上 -o 选项 。 








Hu 























F 31B GNUAssembler 2€ 


下 面 讲解 代码 。 首 先 从 第 2 章 中 讲解 过 的 compiler 类 的 assemble 方法 开始 讲 起 。 
码 如 代码 清单 18.10 所 示 。 
代码 清单 18.10 Compiler 类 的 assemble 方法 ( compiler/Compiler.java ) 








Nu 
4 

> 
cr 


public void assemble(String srcPath, String destPath, 
Options opts) throws IPCException ( 
opts.assembler(errorHandler) 
.assemble(srcPath, destPath, opts.asOptions()); 


) 


首先 对 options 对 象 调 用 assembler J, REl] Assembler XZ. Assembler 是 接 
口 类 ， 其 实体 是 GNUAssembler 对 象 。 目 前 cbe 只 支持 GNU 汇编 纪 ， 这 个 设计 是 为 了 将 来 可 
以 文 持 其 他 汇编 器 。 

然后 对 得 到 的 Assembler 对 象 调用 assemble 方法 ， 开 始 编译 。 


F3 调用 as 命令 
接 下 来 讲解 GNUAssembler 类 的 assemble 方法 ， 其 代码 如 代码 清单 18.11 所 示 。 
代码 清单 18.11 GNUAssembler 类 的 assemble 方法 ( sysdep/GNUAssembler.java ) 
































public void assemble(String srcPath, String destPath, 
AssemblerOptions opts) throws IPCException { 
List«String» cmd = new ArrayList«String»(); 
cmd.add("as"); 
cmd.addAll(opts.args); 
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cmd.add("-o"); 

cmd.add (destPath); 

cmd.add(srcPath); 

CommandUtils.invoke(cmd, errorHandler, opts.verbose); 


) 


这 个 方法 先 往 cma 字符 串 列 表 中 填 人 命令 行 参数 ， 接 着 用 commandUtils 类 的 invoke 
方法 执行 cma 定义 的 as 命令 。 

第 3 ÍTR addA11 方法 把 opts .args 的 值 全 部 添加 到 cmd 中 ， 这 里 的 opts .args 是 从 
cbe 的 命令 行 参 数 接收 的 字符 串 列表 。 壁 如 为 cbe 指定 -Wa，- 工 之 类 的 选项 , 则 opts .args 
天 会 被 填 入 字符 串 " -L"。 而 -Wa 这 个 选项 是 gcc 本 号 也 有 的 选项 ， 被 用 于 把 编译 需 本 号 不 文 
持 的 选项 传递 给 汇编 器 。 

CommandUtils 类 的 invoke 方法 简化 后 就 是 如 下 的 代码 ， 其 主要 逻辑 是 调用 Runtime 


类 的 exec 方法 运行 as 命令 。 











euk 














Static public void invoke(List«String» cmdArgs, 
ErrorHandler errorHandler, boolean verbose) throws IPCException ( 


Process proc - Runtime.getRuntime().exec(cmdArgs.toArray(""- DE: 
proc.waitFor(); 
if (proc.exitValue() !-» 0) ( 








// as 抛 出 错误 终止 执行 ，cbc 也 要 返回 错误 











) 





Runtime 类 的 exec 方法 主要 调用 she11。 因 为 可 以 通过 PATH 变量 定位 命令 并 执行 ， 
此 可 以 很 简单 地 执行 一 个 命令 。 

以 上 简单 地 对 汇编 器 的 调用 进行 了 讲解 。 这 部 分 没有 太 大 难度 ， 也 不 是 本 书 的 重点 ， 因 此 
不 涉及 太 多 细节 。 想 知道 更 多 信息 的 读者 可 以 直接 参考 代码 。 

从 下 一 章 开 始 ， 我 们 将 讲解 链接 器 相关 的 话题 。 























链接 和 库 


本 章 讲解 build 过 程 的 最 后 环节 一 一 链接 和 库 。 
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链接 的 概要 











本 章 开始 讲解 build 过 程 的 最 后 环节 一 一 链接 。 首 先 来 看 链接 的 基本 概念 。 


F3 链接 的 执行 示例 

我 们 先 来 看 看 简单 的 链接 示例 ， 这 里 以 代码 清单 19.1 的 main.c、 代 码 清 单 19.2 的 E.c 这 
两 个 C 语 言 的 源 文 件 为 例 。 
代码 清单 19.1 main.c 








#include <stdio.h> 
extern int f(int n); 


int 

main(int argc, char **argv) 

{ 
printf("f(5)-$dWn", £(5)); 
return 0; 


) 


代码 清单 19.2 fic 
int 
f(int n) 


( 


return n * n; 


) 








main 函数 中 使 用 了 源 文件 £.c 中 定义 的 函数 £。 不 过 因为 main KAGE main. c 中 定 
义 的 ， 所 以 其 函数 实体 被 保存 到 目标 文件 main.o 中 。 又 因为 £ RAE f.c 中 定义 的 ， 所 以 
其 函数 实体 被 保存 到 目标 文件 E.o 中 。 因 此 ， 要 正确 生成 可 执行 文件 ， 最 终 的 可 执行 文件 必须 
包含 两 个 目标 文件 的 内 容 。 这 个 转换 过 程 就 是 链接 。 

首先 分 别 编译 这 两 个 文件 。 在 执行 gcc 命令 时 附 上 -c 选项， 就 可 以 在 编译 后 中 断 build. 





















































S 3s 

Toc maine 

$ gcc -e f.e 

$ gcc -c main.c 
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$ 1s 
£s Eo PERSE TENDO — * 生成 了 *.o 文 件 


这 样 就 生成 了 目标 文件 E.o 和 main.o。 
接 下 来 ， 继 续 使 用 gcc 链接 目标 文件 生成 可 执行 文件 。 单 纯 把 目标 文件 作为 gee 的 命令 行 
参数 就 可 以 生成 可 执行 文件 。 男 外 ,使 用 -o 选项 可 以 指定 输出 文件 名 。 











$ gcc main.o f.o -o prog 

$ 1s 

G oO CE main.c main.o — 生成 了 pzog 文件 
$ ./prog 

iE (1) eds 


这 样 就 可 以 正确 生成 可 执行 文件 prog 并 执行 了 。 

另外 , 像 下 面 这 样 使 用 readelf -s 命令 输出 可 执行 文件 prog 的 符号 表 时 可 以 看 到 ， 
main KAI £ 图 数 都 表示 出 来 了 ， 因 此 可 以 确认 prog 文件 中 同时 包含 了 main.o 和 fE.o 这 
两 个 文件 的 内 容 。 














$ readelf -s prog 


Symbol table '.dynsym' contains 5 entries: 


Num: Value Size Type Bind Vis Ndx Name 
0: 00000000 0 NOTYPE LOCAL DEFAULT UND 
Ce 和 
Symbol table '.symtab' contains 84 entries: 
Num: Value Size Type Bind Vis Ndx Name 
0: 00000000 0 NOTYPE LOCAL DEFAULT UND 
NN ee 
64: 08048390 12 FUNC GLOBAL DEFAULT dU ag 
S FE 
72: 08048354 59 FUNC GLOBAL DEFAULT 12 main 
mu [p EE 





除去 特殊 的 简单 程序 的 情况 ，C 语言 或 者 C++ 程序 都 由 多 个 文件 构成 ， 因 此 链接 可 以 说 是 
程序 开发 必 不 可 少 的 技术 。 
F gcc #0 GNU ld 


使 用 gcc 的 链接 功能 时 ，gcc 程序 内 部 进行 了 什么 样 的 处 理 呢 ? 添加 -v 选项 运行 gcc 后 ， 
可 以 详细 输出 其 内 部 处 理 过 程 。 下 面 就 让 我 们 加 上 -v 选项 再 运行 一 次 gcc 的 链接 过 程 吧 。 





























$ gcc -v main.o f.o -o prog 

Using built-in specs. 

Target: i486-linux-gnu 

Configured with: ../src/configure -v --enable-languages-c,c«-«,fortran,objc, 
obj-c««,treelang --prefix-/usr --enable-shared --with-system-zlib --libexecdirz/ 
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usr/lib --without-included-gettext --enable-threads-posix --enable-nls --program- 
suffix--4.1 --enable-  cxa atexit --enable-clocale-gnu --enable-libstdcxx-debug 
--enable-mpfr --with-tune-i686 --enable-checking-release i486-linux-gnu 


Thread model: posix 
gcc version 4.1.2 20061115 (prerelease) (Debian 4.1.1-21) 
/usr/lib/gcc/i486-linux-gnu/4.1.2/collect2 --eh-frame-hdr -m elf i386 -dynamic- 
linker /lib/Id-Iinux.so.2 -o prog /usr/lib/gcc/i486-linux-gnu/4.1.2/../../.. 4 .. / 
I eo /sl Ae Kee ata re rn/ A /o/ce on Abit Mas e ere) 
i486-linux-gnu/4.1.2/crtbegin.o -L/usr/lib/gcc/i486-linux-gnu/4.1.2 -L/usr/lib/gcc/ 
i486-linux-gnu/4.1.2 -L/usr/lib/gcc/i486-linux-gnu/4.1.2/../../../../lib -L/lib/../ 
lib -L/usr/lib/../lib main.o f.o -lgcc --as-needed -lgcc s --no-as-needed -lc -lgcc 
--as-needed -lgcc s --no-as-needed /usr/lib/gcc/i486-linux-gnu/4.1.2/crtend.o /usr/ 


lib/gcc/i486-linux-gnu/4.1.2/../../../../lib/crtn.o 














首先 输出 的 是 对 gee 本 身 进行 build 时 的 选项 ， 接 着 输出 的 是 gcc 内 部 执行 的 命令 的 参数 。 
这 里 输出 的 参数 非常 杂乱 ， 我 们 看 一 下 最 后 一 行 ， 可 以 看 出 执行 的 命令 是 /usr/libexec/ 
gcc/i686-redhat-linux/4.4.7/collect2, collect2 是 gcc 内 部 使 用 的 命令 ， in 

















接 功能 。 不 过 也 并 不 是 说 由 collect2 本 身 进行 实际 的 链接 操作 ， 而 是 再 调用 别 的 命令 


























体 的 处 理 。 














w 


Linux 中 负责 链接 的 程序 是 /usr/pbin/1d， 这 个 程序 称 为 GNU ldo W FER, JME --help 
选项 执行 collect2 命令 时 ， 输 出 的 是 /usr/bin/1a 的 帮助 信息 ， 这 就 间接 说 明了 collect2 











调用 的 是 /usr/bin/ld. 


$ /usr/lib/gcc/i486-linux-gnu/4.1.2/collect2 --help 
Usage: /usr/bin/ld [options] file... 
Options: 
-a KEYWORD Shared library control for HP/UX compatibility 
-A ARCH, --architecture ARCH 
Set architecture 
-b TARGET, --format TARGET Specify target for following input files 
-c FILE, --mri-script FILE Read MRI format linker script 


( 以 下 省 略 ) 


collect2 正 是 通过 把 包括 - -help 选项 在 内 的 所 有 命令 行 参数 传 给 /usr/bin/1d 来 执行 的 。 








/usr/bin/1d BI GNU 14， 是 进行 链接 操作 的 程序 ， 所 以 一 般 被 称 为 链接 器 ( linker )。 
Linux 中 最 常用 的 链接 器 就 是 GNU ld。 链 接 器 对 OS 是 强 依赖 的 ， 因 此 通常 由 os 提供 商 提 供 。 
壁 如 Microsoft 公司 把 link 这 个 链接 器 作为 Windows SDK 的 一 部 分 发 行 ，Sun Microsystems 公 
司 则 在 Solaris 系统 中 提供 了 1d 命令 。gcc 不 仅 使 用 GNU 14， 也 支持 各 个 公司 提供 的 链接 妖 ， 





























而 collect2 正 是 这 些 不 同 链接 器 的 通用 的 封装 程序 。 


链接 器 处 理 的 文件 








接 下 来 讲解 链接 器 可 以 处 理 的 文件 格式 。 
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链接 需 除 了 处 理 汇编 器 生成 的 目标 文件 以 外 ， 还 可 以 处 理 其 他 不 同形 式 的 文件 。 表 19.1 中 
总 结 了 链接 需 可 以 处 理 的 文件 类 型 。 
表 19.1 链接 器 的 输入 、 输 出 文件 






































文件 类 型 格式 BRA 生成 器 
可 重 定位 文件 ELF .a 汇编 器 
可 执行 文件 ELF (无 ) 链接 器 
共享 库 ELF .SO 链接 器 
静态 库 UNIX ar a ar 命令 























可 重 定位 文件 、 可 执行 文件 、 共 享 库 都 是 ELF 文件 的 一 种 。 只 有 静态 库 种 类 不 同 ， 它 使 用 
的 是 类 似 tar. cpio 一 样 的 档案 文件 。 

下 面 按 顺 序 进行 讲解 。 
可 重 定位 文件 

可 重 定位 文件 (relocatable file) 指 的 是 汇编 带 生 成 的 目标 文件 ， 也 就 是 本 书 前 文中 所 说 的 
“目标 文件 ”， 其 在 Linux 下 的 文件 后 绥 名 为 .o。 

GNU as 生成 的 可 重 定位 文件 没有 程序 头 ， 因 此 不 能 直接 运行 ， 只 有 在 配合 链接 器 与 其 他 可 
重 定位 文件 、 库 产生 链接 之 后 才 可 执行 。 
可 执行 文件 

可 执行 文件 (executable file) 指 的 是 链接 生成 的 用 户 可 直接 运行 的 目标 文件 。Linux 下 可 执 
行文 件 没有 后 级 名 。 一 般 而 言 ， 可 执行 文件 就 是 链接 的 最 终 产 物 。 一 般 在 build 时 不 会 把 可 执行 
文件 再 作为 链接 需 的 输入 。 
共享 库 文 件 

共享 库 文件 ( shared library ) 是 链接 生成 的 另 一 种 形式 的 目标 文件 ， 其 中 集合 了 各 种 函数 、 
变量 等 供 (其 他 ) 用 户 调用 ， 因 此 需要 能 够 再 次 与 其 他 目标 文件 链接 使 用 。 共 享 库 不 会 直接 运 
行 。 共 享 库 也 叫 动态 链接 库 (dynamic link library )。 

Linux 下 共享 库 文件 的 名 称 一 般 以 1ib 开头 ， 以 .so 作为 后 缀 名， 并 加 上 版 本 号 。 壁 如 
libc.so.6, libresolv.so.2 等 就 是 遵从 这 一 惯例 命名 的 文件 名 。 

以 上 就 是 3 种 形式 的 ELF 文件 。 
静态 库 文件 

除了 上 述 3 种 目标 文件 以 外 ，Linux 下 还 有 一 种 叫 作 静态 库 (static library ) 的 文件 可 以 作为 
链接 需 的 输入 。 和 共享 库 文件 一 样 ， 项 态 库 文 件 也 集合 了 各 种 函数 、 变 量 供 CRUS) 用 户 使 用 。 
Linux 下 项 态 库 文 件 的 名 称 一 般 以 lib 开头 ， 以 .a 作为 后 缀 名 。 璧 如 libc.a, libresolv. 
a 就 是 遵从 这 一 惯例 命名 的 文件 名 。 
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静态 库 文件 利用 ax 命令 把 多 个 可 重 定位 文件 打包 成 一 个 ， 因 此 链接 静态 库 文 件 就 相当 于 链 
接 其 中 打包 的 所 有 可 重 定位 文件 。 
以 上 3 种 目标 文件 和 表态 库 文 件 都 可 以 作为 链接 带 的 输入 或 者 输出 。 


F] 常用 库 

Linux 下 发 行 版 提供 的 库 在 文件 系统 的 /1ib 或 者 /usr/1ib 下。 下 面 介绍 其 中 儿 个 使 用 
频率 较 高 的 库 。 

首先 是 标准 C FE (standard C library )， 通 常 称 为 libc。 因 为 Linux 的 libe 是 GNU 的 libe, 
所 以 也 称 为 glibc。libc 中 包含 了 大 量 重 要 的 图 数 ， 从 printf、put、fgets 等 输入 输出 函数 
到 exit、malloc、strlen 等 ， 其 核心 部 分 默认 会 链接 到 C 程序 中 。 也 就 是 说 ， 目 前 为 止 介 
绍 过 的 例子 都 默认 链接 了 libe 的 核心 部 分 。 

libe 的 核心 库 中 ， 共 享 库 是 /1ib/1ibc-X.Y.Z.so (X、Y、Z 是 版 本 号 )， 静态 库 则 是 
/usr/lib/libc.a,; 

其 次 是 提供 sin. pow 等 数学 运算 相关 函数 的 libm。libm 也 是 GNU libe 的 一 部 分 ， 但 库 文 
件 和 libe 是 分 离 的 。libm 的 共享 库 是 /1ib/1ibm-X.Y.2.so， 静 态 库 则 是 /usr/lib/libm.a. 

此 外 ， 还 有 操作 终端 界面 的 库 ncurses。ncurses 被 用 于 vi 等 应 用 程序 ， 使 用 ncurses 库 可 以 
在 终端 的 任意 位 置 输出 文本 ， 在 按 Enter 键 输入 前 获取 之 前 输入 的 所 有 字符 等 。ncurses 的 共享 
库 文 件 是 /lib/libncurses.so.X.Y, MAENE /usr/lib/libncurses.a. 




























































































F3 链接 器 的 输入 和 输出 


在 本 闻 的 最 后 ， 让 我 们 根据 链接 需 的 输入 、 输 出 文件 的 种 类 对 链接 进行 分 类 。Linux 下 主要 
使 用 以 下 两 种 链接 。 








1. 生成 可 执行 文件 的 链接 可 重 定位 文件 静态 库 共 

2. 生成 共享 库 的 链接 

这 两 种 链接 的 输入 是 一 样 的 ， 
都 是 可 重 定位 文件 、 静 态 库 、 共 享 
库 之 中 的 一 个 或 者 几 个 (图 19.1) 

除 此 之 外 ， 还 可 以 把 多 个 可 
重 定位 文件 链接 为 一 个 可 重 定位 
文件 ， 这 样 的 链接 称 为 部 分 链接 图 19.1 ”根据 输出 对 链接 进行 分 类 
( partial link )。 部 分 链接 和 前 两 种 链接 相 比 使 用 频率 相对 较 低 ， 所 以 本 书 中 不 再 说 明 。 


dup 
册 






































可 执行 文件 EJ 
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本 节 将 详细 讲解 链接 时 进行 的 处 理 。 
[F3 链接 时 进行 的 处 理 

下 面 讲解 链接 过 程 中 究竟 进行 了 什么 样 的 处 理 。 所 谓 链 接 (link )， 指 的 是 把 多 个 目标 文件 
关联 为 一 个 整体 。 而 通过 关联 多 个 目标 文件 ， 就 可 生成 同时 使 用 多 个 目标 文件 定义 的 变量 、 郴 
数 的 程序 。 

在 使 用 ELF 格式 的 Linux 下 ， 所 谓 “ 把 多 个 目标 文件 关联 为 一 个 整体 ”， 具 体 来 说 需要 经 过 
以 下 步骤 。 

1. 合并 节 

2. 重 定位 

3. 符号 消解 

仔细 思考 之 后 可 以 发 现 ， 除 了 以 上 3 个 步骤 以 外 ， 链 接 时 还 必须 进行 很 多 其 他 处 理 。 璧 如 
在 生成 ELF 格式 的 可 执行 文件 时 ， 需 要 为 程序 生成 合适 的 程序 头 信 息 。 不 过 归根 到 底 ， 链 接 的 












































主旨 是 关联 目标 文件 ， 因 此 主要 的 处 理 也 就 上 述 3 点 。 
下 面 就 按 顺序 来 详细 讲解 这 3 点 。 
J estis 








首先 讲解 合并 节 。 正 如 我 们 在 第 18 章 中 提 到 的 那样 ， 各 种 目标 文件 中 都 有 保存 机 器 码 
的 text 节 、 保 存 全 局 变量 内 存 空间 的 .data 节 等 。 在 链接 多 个 目标 文件 时 ， 需 要 从 各 个 目 
标 文 件 中 抽取 节 ， 把 相同 种 类 的 节 合并 到 一 起 ， 如 图 19.2 所 示 。 这 个 处 理 就 是 “合并 节 ”。 
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对 象 文件 1 





192 合并 节 


重 定位 

接着 讲解 重 定位 。 重 定位 (relocation ) 指 的 是 根据 程序 实际 加 载 到 内 存 时 的 地 址 ， 对 目标 

文件 中 的 代码 和 数据 进行 调整 。 
举 个 例子 。 假 设 现 在 有 a.c、pb.c、c.c 这 3 个 C 语 言 的 源 文件 ， 我 们 要 把 它们 编译 、 汇 
编 、 链 接 从 而 得 到 可 执行 文件 。 在 一 般 的 C 语言 编译 环境 中 ， 因 为 3 个 源 文件 都 是 独立 编译 和 
汇编 的 ， 所 以 相互 之 间 并 不 知道 其 他 目标 文件 使 用 的 是 什么 内 存 地 址 ， 因 此 地 址 重复 的 情况 很 
有 可 能 发 生 。 壁 如 a.c ÆR a.o 的 时 候 ,， 假设 要 把 代码 载 和 内存 中 从 100 开始 的 位 置 ， 然 而 这 
段位 置 可 能 已 经 放置 了 b.o 或 者 c.o 的 代码 ， 这 时 从 100 开始 的 内 存 位 置 就 不 可 用 了 。 其 他 地 
址 也 可 能 有 同样 的 问题 。 

这 时 就 需要 用 到 重 定位 。 首 先 ， 最 初生 成 目标 文件 a.o 或 者 b.o 时 , 使 用 虚拟 的 内 存 地 
址 ， 比 如 地 址 100 等 。 然 后 把 代码 、 数 据 的 位 置信 息 设置 为 相对 100 位 置 的 内 存 地 址 ， 并 且 记 
录 在 同一 个 目标 文件 中 。 这 个 信息 就 是 第 18 章 中 讲 过 的 重 定位 信息 。 接 着 在 链接 3 个 目标 文件 
时 ,根据 整体 情况 决定 “真实 的 ”内 存 地 址 ， 把 所 有 使 用 虚拟 内 存 地 址 的 地 方 蔡 换 成 真实 的 内 
存 地 址 。 这 个 处 理 就 是 重 定位 。 

图 19.3 展示 了 重 定位 的 概念 。 
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100: movl : 100: sub 


105: jmp .LO ; 107: movl 











100: movl : 300: sub 


105: jmp .LO : 307: movl 








图 19.38 重 定位 的 概念 


最 初 a.o、b.o、c.o 都 是 假设 从 地 址 100 开始 生成 目标 文件 的 。 链 接 时 b . o 变 为 从 200 
FAR, c.o 变 为 从 300 开始 。 通 过 重 定位 ，3 个 目标 文件 使 用 的 内 存 地 址 不 再 重复 ， 可 以 简单 
地 结合 起 来 。 


F3 符号 消解 


最 后 讲解 符号 消解 相关 的 内 容 。 符 号 消解 (symbol resolution ) 是 指 为 了 可 以 使 用 其 他 目标 
文件 和 库 文件 中 提供 的 变量 或 者 函数 ， 把 尚未 和 实体 链接 的 符号 与 具体 的 变量 或 者 函数 等 实体 
链接 起 来 的 操作 。 第 9 章 中 已 经 讲解 过 变量 引用 消解 的 相关 内 容 ， 这 里 可 以 把 符号 消解 想象 成 
在 不 同 的 目标 文件 中 进行 变量 引用 消解 。 

比如 ， 我 们 要 在 main.c 这 个 C 语 言 ns 库 提供 的 printf K% 
printf 函数 的 定义 在 C 库 文件 (1ib.c) 中 ， 因 此 需要 把 这 个 函数 体 从 库 文件 中 提取 出 来 进 
行 链接 。 而 汇编 右 不 是 链接 器 ， 因 此 进行 汇编 操作 后 ，printf 函数 的 函数 体 并 没有 被 提取 过 
来 。 相 应 地 ， 汇 编 器 会 把 “这 个 目标 文件 中 使 用 的 printf 函数 的 函数 体 在 其 他 目标 文件 中 ” 
这 个 信息 保留 下 来 。 这 个 信息 就 是 未 定义 符号 (undefined symbol )。 
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接 下 来 ， 在 进行 链接 操作 的 时 候 ， 再 检索 未 定义 符号 ， 把 相关 的 变量 或 者 函数 的 内 存 地 址 
链接 进来 。 这 个 处 理 就 是 符号 消解 。 

符号 消解 和 重 定 位 联系 紧密 。 

壁 如 上 面 的 printf KAŽ, Æ main.c XF printf 国 数 的 地 址 是 未 知 的 ， 这 时 编译 
器 为 printf 函数 分 配 虚拟 地 址 ， 并 生成 类 似 call printf 的 汇编 指令 。 然 后 在 链接 时 再 把 
函数 的 内 存 地 址 修正 为 正确 地 址 。 

而 这 个 “ 先 设置 虚拟 地 址 ， 在 链接 时 修正 为 正确 地 址 ”的 处 理 正 是 重 定 位 操作 ， 因 此 符号 
消解 本 身 可 以 通过 重 定 位 来 实现 。 

总 体 来 说 ， 像 上 面 这 样 解释 目标 文件 代码 的 含义 ， 把 目标 文件 从 物理 上 、 逻 辑 上 链接 起 来 ， 
从 而 生成 可 执行 文件 的 处 理 就 是 “链接 ”。 
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本 节 将 讲解 动态 链接 和 静态 链接 的 异同 。 
[y 两 种 链接 方法 
无 论 是 静态 库 还 是 共享 库 ， 都 是 为 了 集合 一 系列 函数 或 者 变量 以 供 ( 其 他 ) 用 户 使 用 ,不 


过 两 种 库 的 链接 方式 却 有 很 大 不 同 。 
静态 库 在 build， 也 就 是 执行 1a 命令 的 时 候 就 会 进行 目标 文件 的 链接 ， 而 共享 库 在 build 的 
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实际 链接 目标 文件 。 
其 中 ,在 build 时 链接 目标 文件 的 链接 操作 称 为 静态 链接 (static link )， 而 在 程序 执行 时 链 
接 目 标 文 件 的 链接 操作 则 称 为 动态 链接 (dynamic link )。 通 常 静态 库 使 用 的 是 静态 链接 ， 而 共 
享 库 则 使 用 动态 链接 。 另 外 ， 给 链接 顺 输 入 多 个 重 定位 文件 时 ， 这 些 文件 会 被 执行 项 态 链接 。 
动态 链接 的 优点 很 多 ，Linux 下 使 用 库 时 也 主要 使 用 共享 库 和 动态 链接 。gcc 也 是 如 此 ， 不 
加 任何 选项 的 话 就 会 执行 动态 链接 ， 而 静态 库 的 静态 链接 只 在 个 别 情况 下 才 使 用 。 


反动 态 链接 的 优点 
动态 链接 的 优点 主要 有 以 下 3 点 。 
1. 容易 更 新 
2. 节省 磁盘 空间 
3. 节省 内 存 
首先 ， 进 行动 态 链接 可 以 很 方便 地 更 新 库 。 想 要 更 新 共享 库 的 时 候 ， 只 需要 安装 新 的 共享 
库 文件 即 可 。 而 更 新 静态 库 则 还 需要 把 所 有 链接 了 该 静态 库 的 文件 重新 进行 链接 处 理 。 近 来 因 
为 安全 等 原因 ， 库 文件 更 新 的 频率 非常 高 ， 因 此 容易 更 新 这 个 优点 可 以 说 是 无 可 蔡 代 的 。 
其 次 ,使 用 动态 链接 可 以 节省 磁盘 空间 。 链 接 静 态 库 时 ， 静 态 库 的 所 有 内 容 都 将 被 复制 到 
可 执行 文件 中 ， 因 此 在 每 一 个 链接 了 静态 库 的 文件 中 都 将 存在 一 份 静态 库 的 副本 。 而 共享 库 不 
会 被 物理 复制 到 链接 的 目标 文件 中 ， 也 就 不 会 因为 同时 存在 多 份 副 本 而 造成 磁盘 空间 的 浪费 。 
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最 后 ， 使 用 动态 链接 可 以 节省 内 存 。 占 据 库 大 部 分 体积 的 .text 节 是 只 读 区 域 ， 通 过 
mmap 系统 调用 把 共享 库 文件 内 容 加 载 到 内 存 后 ， 多 个 进程 可 以 共用 一 个 内 存 区 域 。 也 就 是 说 ， 
即使 使 用 某 个 共享 库 的 进程 同时 启动 了 多 个 ， 它 们 也 只 会 共用 同一 个 加 载 了 共享 库 的 内 存 区 域 。 


F3 动态 链接 的 缺点 

另外 ， 动 态 链接 的 缺点 有 以 下 两 个 。 

1. 性 能 稍 差 

2. 链接 具有 不 确定 性 

第 一 点 ， 相 同 条 件 下 ， 比 起 静态 链接 而 言 ， 使 用 动态 链接 时 程序 性 能 会 稍微 差 一 点 。 一 来 
在 程序 运行 时 进行 链接 操作 需要 花费 一 定 的 时 间 ， 二 来 第 21 章 中 讲解 的 地 址 无 关 代 码 的 执行 也 
会 有 一 些 额外 的 开销 。 不 过 整体 来 说 ， 执 行 速度 下 降 的 幅度 应 该 不 会 超过 5%。 

第 二 点 ， 如 果 使 用 动态 链接 ， 那 么 在 实际 链接 时 就 可 以 简单 地 完成 变量 、 函 数 的 替换 。 举 
个 例子 ， 如 果 把 某 个 文件 夹 路 径 设置 为 环境 变量 LD _LIBRARY _ PATH， 那么 程序 在 执行 时 就 会 
优先 检索 LD LIBRARY PATH， 而 不 是 /1ib 和 /usr/1ib。 这 就 导致 用 户 甚 至 可 以 把 libc、 
libm 等 库 替 换 成 自己 准备 好 的 库 。 也 就 是 说 ， 在 Linux 上 使 用 动态 链接 的 情况 下 ， 有 可 能 链接 
不 到 原本 想 要 链接 的 变量 或 者 函数 。 

当然 ， 这 一 点 也 不 能 完全 说 是 缺点 。 比 方 说 通过 LD_LIBRARY_PATH 可 以 相对 方便 地 做 到 
仅仅 替换 标准 C EERI malloc 函数 。 另 外 ， 利 用 这 一 点 还 可 以 很 方便 地 为 libe 函数 调用 加 上 
钩子 进行 追踪 ， 相 对 于 在 代码 中 埋 点 打印 日 志 而 言 ， 这 种 方法 无 疑 更 具 价 值 。 


F 动态 链接 示例 

接 下 来 我 们 分 别 尝试 进行 动态 链接 和 静态 链接 。 

首先 进行 动态 链接 。 这 里 使 用 的 源 代码 就 是 前 面 用 过 的 main.c H E. co 假设 我 们 要 把 源 
代码 和 libc 的 引用 明确 地 进行 动态 链接 。 编译 main.c 和 f.c， 对 重 定位 文件 和 libe 进行 动态 
链接 的 例子 如 下 所 示 。 























































































































$ gcc -c main.c 
$ gcc -e f.c 
$ gcc main.o f.o -lc -o prog 


这 里 命令 行 参数 - 1c 是 关键 。gcc 的 -1 选项 可 以 为 链接 指定 库 。- lxx 这 样 的 选项 表示 动 
态 链 接 时 检索 1ibxx . so 库 ， 静 态 链 接 时 检索 1 ibxx .a 库 。 男 外 ,动态 链接 时 如 果 检 索 不 到 
1ibxx.so， 也 会 自动 检索 1ibxx .a。 如 果 后 者 检测 到 了 ， 则 会 自动 进行 静态 链接 。 

要 确定 指定 库 是 否 被 动态 链接 ， 可 以 如 下 所 示 使 用 Lda 命令 。 
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$ ldd prog 
linux-gate.so.1 -»  (Oxffffe000) 
libc.so.6 -» /lib/tls/i686/cmov/libc.so.6 (0xb7e86000) 
/lib/ld-linux.so.2 (0xb7fbf000) 


ldd 像 上 面 这 样 输出 1ibc.so.6 => ...， 则 代表 这 个 文件 动态 链接 了 共享 库 libc.so.6. 


静态 链接 示例 


接 下 来 看 静态 链接 。 如 下 所 示 ，gcc 使 用 -static 选项 即 可 进行 静态 链接 。 








$ gcc -static main.o f.o -lc -o prog 


这 样 一 来 ，main.o、f.o 以 及 libc .a 就 会 被 静态 链接 ， 从 物理 上 关联 成 一 个 文件 。 
对 静态 链接 后 的 文件 执行 18a 命令 可 以 得 到 如 下 信息 。 











$ ldd prog 
not a dynamic executable 


另外 ， 执行 file 命令 时 还 会 输出 如 下 statically linked 的 信息 ， 据 此 可 以 知道 进行 
了 静态 链接 。 


$ file prog 
prog: ELF 32-bit LSB executable, Intel 80386, version 1 (SYSV), for GNU/Linux 
2.4.1, statically linked, for GNU/Linux 2.4.1, not stripped 


[y 库 的 检索 规则 

为 gce 指定 -1 选项 检索 库 时 ， 首 先 被 检索 的 是 gce 内 含 的 检索 路 径 。 在 检索 该 路 径 时 ， 可 
以 通过 给 gce 加 上 -v 选项 并 执行 ， 从 输出 的 collect2 的 命令 行 参数 中 查找 - 工 选 项。 在 笔者 
手头 的 执行 环境 里 ， 除 去 重复 的 值 以 外 ， 一 共有 如 下 3 个 路 径 。 











-L/usr/lib/gcc/i486-linux-gnu/4.1.2 
-L/usr/lib 
-L/lib 


这 3 个 就 是 默认 的 检索 目标 路 径 。 另 外 ，/uszry/Lib/gcc/.. .是 gcc 的 内 部 库 、 命 令 的 
存放 路 径 ， 其 中 存放 着 包含 gcc VJEXPRZIUEPJR 1ibgco 等 文件 。 此 外 ，collect2 文件 也 在 
这 个 路 径 下 。 

如 果 要 链接 位 于 上 述 标准 路 径 之 外 的 地 方 的 库 ， 可 以 通过 以 下 任意 一 种 方法 。 











1. 不 使 用 -1 选项 ， 而 是 为 gcc 指定 库 的 完整 路 径 
2. 给 gcc 指定 - 工 选 项 ， 将 文件 夹 路 径 添 加 到 检索 路 径 








382 | 第 19 章 链接 和 库 





第 1 种 方法 比较 易 懂 ， 下 面 讲 解 一 下 第 2 种 。 为 gcc 命令 添加 “- 工 文件 天 路 径 ” 的 参数 
后 ， 这 个 文件 夹 路 径 就 被 添加 到 了 gcc 的 检索 路 径 ， 然 后 再 在 这 个 文件 夹 路 径 中 检索 -1 选项 
指定 的 库 。 

工 选 项 可 以 指定 多 个 ， 因 此 如 果 有 多 个 想 要 检索 的 路 径 ， 可 以 反复 指定 -L 选项 。 

下 一 节 将 讲解 生成 库 的 方法 。 














本 证 将 讲解 利用 gcc 生成 库 的 方法 。 


生成 静态 库 





首先 讲解 生成 静态 库 的 方法 。 
用 ax 命令 可 以 生成 静态 库 。az 命令 的 功能 和 tar 类似, 使 用 方法 也 差不多 。 
要 用 az 命令 生成 静态 库 ， 需 要 像 下 面 这 样 指 定 c、r、s 选项 ， 并 指定 生成 的 静态 库 文件 
名 ， 以 及 相应 的 重 定 位 文件 列表 。 





$ ar crs libmy.a f.o g.o h.o 





这 样 就 可 以 生成 包含 f.o、g.o、h.o 这 3 个 重 定位 文件 的 静态 库 1ipmy.a。 其 中 ， 各 个 
选项 的 含义 如 表 19.2 所 示 。 


表 19.2 ar 命令 的 选项 





选项 


含义 





如 果 存档 不 存在 ， 则 创建 








向 存档 添加 文件 














生成 加 速 链 接 的 索引 








根据 OS 的 不 同 ，ar 命令 可 能 必须 使 用 ranlib 命令 生成 索引 。 但 Linux 的 情况 下 ， 因 为 


az 命令 的 s 选项 就 可 以 生成 索引 ， 所 以 不 需要 额外 执行 ranlib 命令 。 另 外 ， 即 便 不 生成 索 
引 ， 静 人 态 库 也 可 以 正常 工作 。 


Linux 中 共享 库 的 管理 





在 讲解 生成 共享 库 的 方法 前 ， 让 我 们 先 来 简单 了 解 一 下 Linux 下 共享 库 的 版 本 管理 方法 。 
为 了 让 多 个 版 本 的 共享 库 共 存 ，Linux 下 有 几 条 共享 库 的 命名 规则 。 



































表 19.3 ”共享 库 的 命名 规则 

种 类 使 用 者 命名 规则 示例 

实名 lib X x X .so.A.B.C libz.so.1.2.3 
soname 加 载 器 lib X X X .so.A libz.so.1 
链接 器 名 链接 器 lib X X X .so libz.so 
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实名 指 的 就 是 用 户 可 以 简单 理解 的 名 字 。 具 体 来 说 就 是 在 1ib x x x .so 的 基础 上 加 上 3 
位 版 本 号 ， 也 可 以 是 2 位 版 本 号 。 

soname 是 加 载 器 在 加 载 程序 时 为 了 检索 共享 库 而 使 用 的 名 字 。 具 体 来 说 就 是 在 
libx x x .so 的 基础 上 加 上 1 位 版 本 号 。soname 的 版 本 号 必定 是 1 位 。 

最 后 的 链接 需 名 是 链接 器 (18) 在 进行 链接 操作 时 检索 库 而 使 用 的 名 字 。 链 接 需 名 没有 版 
本 号 。 
通常 的 做 法 是 使 用 实名 为 文件 实体 命名 ， 并 且 为 其 创建 以 soname 或 者 链接 器 名 命名 的 符号 
链接 文件 。 

另外 ，soname 的 . so 后 的 版 本 号 是 ABI (Application Binary Interface ) 版 本 号 。 更 改 已 有 
的 库 接口 后 ， 新 的 版 本 号 一 定 要 比 原来 的 版 本 号 大 。 所 谓 ABI 是 指 在 机 器 码 层面 保证 库 的 可 替 
换 性 的 接口 。 

打 个 比方 ， 如 果 增 加 了 已 有 函数 的 参数 个 数 或 者 删除 了 某 个 已 有 函数 ， 那 么 使 用 现 有 版 本 
的 库 的 程序 就 有 可 能 无 法 正常 工作 。 这 种 情况 就 称 为 “ABI 没有 可 替换 性 ”。 在 ABI 没 有 可 蔡 
换 性 的 情况 下 ， 必 须 增加 ABI 版 本 号 ，soname 末尾 的 版 本 号 也 必须 随 之 增加 。 男 一 方面 ， 单 纯 
增加 新 函数 的 情况 下 ， 使 用 现 有 版 本 库 的 程序 可 以 照常 运作 ， 所 以 ABI 无 需 更 改 ，soname 也 无 
需 更 改 。 

此 外 ，Linux 下 为 优化 执行 时 共享 库 的 检索 速度 ， 加 载 器 会 对 共享 库 的 信息 建立 缓存 文件 。 
这 个 缓存 文件 就 是 /etc/1d.so.cache。 安 装 新 版 本 的 共享 库 时 ， 一 定 要 更 新 这 个 缓存 文件 。 
更 新 /etc/1d.so.cache 文件 需要 以 管理 员 权 限 执行 ldconfig 命令 。 


生成 共享 库 时 有 几 个 注意 事项 ， 其 中 特别 需要 注意 以 下 2 点 。 


1. 加 上 -fPIC 选项 编译 共享 库 的 所 有 源 文件 

2. 生成 共享 库 时 ， 加 上 -w1 选项 可 以 应 用 soname 

第 1 点 中 的 -fPIC 选项 是 生成 地 址 无 关 代 码 的 选项 。 地 址 无 关 代 码 的 应 用 可 以 减少 链接 时 
的 重 定位 操作 ， 在 生成 共享 库 时 几乎 是 必需 的 手段 。 地 址 无 关 代码 相关 的 内 容 详 见 第 21 章 。 

第 2 点 则 是 前 文 提 及 的 为 共享 库 应 用 soname 的 步 又 。 虽 然 不 应 用 soname 库 也 能 正常 工作 ， 
但 为 了 做 好 版 本 管理 ， 还 是 推荐 为 共享 库 应 用 soname。 

那么 下 面 我 们 来 生成 共享 库 。 首 先 ， 加 上 -fPIC 选项 来 编译 共享 库 包含 的 所 有 源 文件 。 


















































































































































$ gcc -c -fPIC f.c 
Saqcon co EPICII e 
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接 下 来 ， 加 上 -shared、-Wl 和 -soname 选项 执行 gcc 命令 ， 生 成 共享 库 。 


$ gcc -shared -Wl,-soname,libfg.so.l f.o g.o -o libfg.so.1 
$ file libfg.so.1 
libfg.so.1: ELF 32-bit LSB shared object, Intel 80386, version 1 (SYSV), not stripped 




















这 样 就 生成 了 一 个 共享 库 。 执 行 file 命令 可 以 确认 生成 的 文件 是 shared object. 

另外 ，-static 选 项 用 于 指示 进行 静态 链接 ， 而 -shared 选项 则 用 于 指示 生成 共享 库 。 
这 两 个 选项 的 含义 稍 有 点 区 别 。 

下 面 详细 讲解 -Wl1, -soname,1ibfg.so.1。 首 先 ，-Wl 选项 用 于 向 链接 器 (1d 命 

S) 传递 参数 。 传 递 的 不 同 参 数 之 间 用 逗号 分 隔 ， 并 且 互 相 之 间 没 有 空格 。 也 就 是 说 ，-WLl， 
-soname,1Libfg.so.l 的 意思 是 为 链接 器 加 上 -soname 和 1ibfg.so.1 两 个 参数 。 这 样 就 
可 以 为 共享 库 应 用 soname。 

然后 为 readelf 命令 加 上 -a 选项， 就 可 以 确认 应 用 的 soname。 








$ readelf -d libfg.so.1 


Dynamic section at offset 0x548 contains 21 entries: 


Tag Type Name/Value 

0x00000001 (NEEDED) Shared library: [libc.so.6] 
0x0000000e (SONAME) Library soname: [libfg.so.1] 
0x0000000c (INIT) 0x38c 


F3 链接 生成 的 共享 库 


要 链接 如 上 生成 的 动态 库 ， 有 几 点 需要 

首先 ， 为 了 让 gcc 的 -1 选项 生效 ， 必 a 因此 必须 生成 * . so 这 样 的 符 
号 链接 。 

另外 ， 当 前 路 径 并 不 在 gcc 的 默认 检索 路 径 中 ， 因 此 需要 加 上 -L. 选项 来 链接 当前 路 径 下 
的 共享 库 。 

总 结 起 来 就 是 下 面 这 样 。 

















$ 1n -s libfg.so.1 libfg.so — 生成 链接 器 名 
$ gcc -c main.c 
$ gcc -L. main.o -lfg -lc -o prog-shared SUITE ES Th ze ER 








另外 ， 在 运行 使 用 了 共享 库 的 程序 时 也 需要 注意 一 点 ， 那 就 是 默认 情况 下 当前 路 径 也 不 是 
执行 时 的 检索 路 径 。 想 要 直接 把 生成 的 共享 库 放 置 到 当前 路 径 中 使 用 ， 而 不 进行 安装 ， 就 需要 
把 环境 变量 LD_LIBRARY_PATH 指定 为 “.”。 也 就 是 说 ， 执 行 的 命令 应 如 下 所 示 。 

















$ LD LIBRARY PATH=. ./prog-shared 
f£(5)yz25 
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最 后 ， 在 安装 生成 的 共享 库 时 ， 复 制 共 享 库 到 相应 路 径 后 ， 需 要 以 管理 员 权 限 执 行 
ldconfig 命令 ， 如 下 所 示 。 











# ldconfig # 需要 管理 员 权 限 


下 一 章 将 详细 讲解 程序 的 加 载 和 动态 链接 相关 的 内 容 。 








加 载 程序 


本 章 来 讲解 程序 加 载 的 进程 。 
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加 载 ELF 段 








本 节 将 讲解 ELF 段 的 加 载 过 程 和 相应 的 内 存 操作 。 


利用 mmap 系统 调用 进行 文件 映射 


Linux 系统 下 通过 mmap 系统 调用 把 程序 加 载 到 内 存 中 。mmap 是 把 文件 内 容 映 射 到 内 存 空 
间 中 的 系统 调用 。 所 谓 “ 有 映射"， 意 思 是 可 以 通过 读 取 内 存 直接 获得 文件 内 容 ， 也 可 以 通过 写 内 
存 对 文件 内 容 进行 变更 。 

下 面 就 来 讲解 把 文件 映射 到 内 存 中 的 mmap 系统 调用 的 用 法 。mmap 系统 调用 的 函数 原型 如 
下 所 示 。 

















#include <sys/mman.h> 


void *mmap(void *start, size t length, int prot, int flags, 
nantetd RORE CEORESCIE 


mmap 把 文件 内 容 映射 到 以 start 地 址 开始 的 长 度 为 length 字 节 的 内 存 空 间 上 。 而 被 映 
射 到 内 存 上 的 文件 的 范围 则 是 : 由 文件 描述 符 fa 指定 的 文件 中 ， 从 偏 移 量 offset 开始 ， 长 度 
为 length 字 节 的 部 分 。 

mmap 系统 调用 的 返回 值 为 实际 映射 到 的 内 存 空 间 的 起 始 地 址 。 内 存 分 配 失败 时 会 返回 常量 
MAP FAILED, 

下 面 来 详细 介绍 mmap 的 参数 。 

只 有 在 第 4 个 参数 没有 指定 为 MAP_FIXED 的 情况 下 ， 第 1 个 参数 start 才 可 被 更 改 。 一 
般 情 况 下 mmap 系统 调用 都 不 指定 MAP_FIXED， 于 是 把 第 1 个 参数 start 设置 为 0， 由 系统 
内 核 决定 内 存 地 址 。 不 过 ， 加 载 程 序 的 时 候 必 须 把 文件 映射 到 特定 的 内 存 地 址 上 ， 因 此 需要 指 
定 MAP FIXED 标志 ， 禁 止 更 改 start. 

第 3 个 参数 prot 是 表示 作为 映射 目标 的 内 存 空间 的 访问 属性 的 标志 。 可 以 把 表 20.1 中 的 
一 个 或 多 个 值 用 比特 单位 的 OR 指定 为 标志 值 。 
表 20.1 可 以 指定 为 第 3 个 参数 prot 的 标志 





















































标志 名 含义 











PROT_NONE 不 能 访问 指定 的 内 存 空间 
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( 续 ) 
标志 名 含义 
PROT_READ 指定 的 内 存 空间 可 读 
PROT. WRITE 指定 的 内 存 空间 可 写 
PROT_EXEC 指定 的 内 存 空 间 上 的 代码 可 执行 
可 以 把 表 20.2 中 的 一 个 或 多 个 值 用 比特 单位 的 OR 指定 为 第 4 个 参数 f1ags 的 标志 值 。 另 





外 ， 标 志 值 必须 包括 MAP SHARED 和 MAP PRIVATE 之 中 的 一 个 。 


表 20.2 可 以 指定 为 第 4 个 参数 flags 的 部 分 标志 






























































标志 名 含义 

MAP. FIXED 严格 从 第 1 个 参数 start 指定 的 地 址 开始 映射 。 如 果 目 标 内 存 空间 和 已 经 映射 的 内 存 空 间 重 车 ， 
则 新 的 映射 将 覆盖 旧 的 映射 

MAP_SHARED 将 映射 了 文件 的 内 存 空间 和 其 他 进程 共享 。 指 定 了 这 个 标志 后 ， 如 果 映 射 了 文件 的 内 存 空间 发 
生变 更 ， 变 更 结果 将 同步 到 文件 中 

































































MAP_PRIVATE 于 映射 了 文件 的 内 存 空 间 不 和 其 他 进程 共享 。 指 定 了 这 个 标志 后 ， 映 射 了 文件 的 内 存 空间 将 变 
成 本 进程 专用 ， 不 再 和 其 他 进程 共享 
MAP ANONY- | 确保 文件 内 容 和 可 用 的 内 存 空间 。 指 定 了 这 个 标志 后 ， 第 5 个 参数 fd 和 第 6 参数 offset 都 将 
MOUS 被 忽略 


通过 使 用 mmap 系统 调用 把 ELF 文件 的 节 进 行 映射 ， 程 序 就 被 加 载 到 了 内 存 中 。 


进程 的 内 存 镜像 


在 Linux 下 ， 通 过 使 用 Proc 文件 系统 ( /proc )， 就 可 以 表示 进程 利用 mmap 系统 调用 把 文 
件 上 映射 到 的 内 存 范围 的 信息 。 利 用 这 个 功能 ， 下 面 让 我 们 来 看 一 个 典型 的 加 载 完毕 的 程序 吧 。 

如 下 所 示 ， 利 用 cat 命令 输出 /proc/ 进程 ID/maps 文件 的 内 容 ， 就 可 以 表示 某 个 进程 
中 文件 和 内 存 映 射 的 信息 。 
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$ cat /proc/4437/maps 


08048000-08049000 r-xp 00000000 08:01 130567 /tmp/showmap 
08049000-0804a000 rwxp 00000000 08:01 130567 /tmp/showmap 
0804a000-0806b000 rwxp 0804a000 00:00 0 [heap] 


b7e34000-b7e35000 rwxp b7e34000 00:00 0 

b7e35000-b7f5c000 r-xp 00000000 08:01 2497754 /lib/tls/i686/cmov/libc-2.3.6.so 
b7f£5c000-b7f£61000 r-xp 00127000 08:01 2497754 /lib/tls/i686/cmov/libc-2.3.6.so 
b7£61000-b7f£63000 rwxp 0012c000 08:01 2497754 /lib/tls/i686/cmov/libc-2.3.6.so 
b7£63000-b7f£66000 rwxp b7f£63000 00:00 0 

b7f£6a000-b7f6d000 rwxp b7f6a000 00:00 0 

b7f£6d000-b7f£6e000 r-xp b7f6d000 00:00 0 [vdso] 

b7£6e000-b7£83000 r-xp 00000000 08:01 2482360 /lib/1d-2.3.6.s80 
b7£83000-b7£85000 rwxp 00014000 08:01 2482360 /lib/1d-2.3.6.s0 
bfc30000-bfc46000 rwxp bfc30000 00:00 0 [stack] 


以 上 是 一 个 调用 sleep 函数 后 退出 的 Cb 程序 执行 后 得 到 的 内 存 映射 。 其 输出 从 左 往 右 分 
是 内 存 地 址 范围 C16 进 制 数 表示 )、 内 存 范围 的 访问 权限 属性 、 对 应 文件 的 偏 移 量 、 设 备 号 、 














a 
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i 市 点 号 和 对 应 的 文件 名 。 目 前 来 说 ， 比 较 重 要 的 是 内 存 地 址 范围 、 属 性 和 对 应 的 文件 名 ， 让 我 
们 来 看 一 下 。 

首先 ， 内 存 地 址 范围 是 用 16 进 制 数 来 表示 内 存 空间 的 上 端 和 下 端 地 址 。 壁 如 08048000- 
08049000 指 的 就 是 “由 地 址 0x08048000 到 地 址 0x08049000”。 

其 次 , “对 应 的 文件 名 ” 指 的 是 使 用 mmap 系统 调用 映射 的 文件 名 。 从 上 述 输 出 中 可 以 看 到 ， 
/tmp/showmap (程序 ) 和 /1ib/tls/i686/cmov/1ibc-2.3.6.so (libe) 都 被 映射 了 。 

下 面 来 详细 介绍 内 存 空间 的 属性 。 


FJ 内 存 空间 的 属性 

/proc/ 进程 ID/maps 的 输出 中 ， 类 似 于 r-xp 的 字符 串 的 每 一 位 都 表示 内 存 空间 的 访问 
属性 ， 并 和 mmap 系统 调用 的 第 3 个 参数 prot 对 应 。 其 中 各 个 字符 的 含义 如 表 20.3 所 示 。 
表 20.3 内存 范围 的 属性 

















































































































位 字符 含义 
1 r 为 存 空 间 可 读 
内存 空间 不 可 读 
2 w 为 存 空间 可 写 
内 存 空 间 不 可 写 
3 x 为 存 空 间 中 的 代码 可 执行 
为 存 空间 中 的 代码 不 可 执行 
4 S 为 存 空 间 和 其 他 进程 共享 ( 使 用 MAP. SHARED 标志 映射 ) 
p 为 存 空间 由 当前 进程 私有 ( 使 用 MAP. PRIVATE 标志 映射 ) 
































打 个 比方 ， 机 器 码 通常 不 需要 更 新 ， 因 此 .text 节 对 应 的 内 存 空 间 应 该 不 可 写 。 如 果 机 器 
码 不 可 写 ， 那 么 就 不 会 因为 程序 错误 而 改写 机 融 码 ， 进 而 也 防止 了 恶意 自 改 代码 的 攻击 行为 。 

另外 ， 以 往 机 需 栈 的 内 存 空间 通常 是 可 执行 的 ， 最 近 出 于 安全 方面 的 考虑 ， 很 多 技术 方案 
里 都 把 机 带 栈 设置 为 不 可 执行 了 。 因 为 如 果 机 带 栈 可 执行 ,电脑 病毒 就 可 以 利用 程序 的 漏洞 往 
栈 上 写 入 代码 ， 从 而 就 可 以 实施 攻击 了 。 


y ELF 段 对 应 的 内 存 空间 


这 里 再 确认 一 次 被 加 载 的 ELF 文件 的 程序 头 。 通 过 readelf -1 命令 可 以 输出 程序 头 。 
上 述 显示 内 存 映 射 的 /tmp/showmap 命令 的 程序 头 如 下 所 示 。 









































$ readelf -1 /tmp/showmap 


Elf file type is EXEC (Executable file) 
Entry point 0x8048350 
There are 7 program headers, starting at offset 52 


Program Headers: 


20.1 
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Type Offset VirtAddr PhysAddr FileSiz MemSiz  Flg Align 

PHDR 0x000034 0x08048034 0x08048034 0x000e0 0x000e0 R E 0x4 

INTERP 0x000114 0x08048114 0x08048114 0x00013 0x00013 R 0x1 

[Requesting program interpreter: /lib/ld-linux.so.2] 

LOAD 0x000000 0x08048000 0x08048000 0x004b0 0x004b0 R E 0x1000 

LOAD 0x0004b0 0x080494b0 0x080494b0 0x000f4 0x000f4 RW 0x1000 

DYNAMIC 0x0004b0 0x080494b0 0x080494b0 0x000c8 0x000c8 RW 0x4 

NOTE 0x000128 0x08048128 0x08048128 0x00020 0x00020 R 0x4 

GNU STACK 0x000000 0x00000000 0x00000000 0x00000 0x00000 RWE 0x4 
Section to Segment mapping: 

Segment Sections... 

00 

01 o alipie Ereg) 

02 .interp .note.ABI-tag .hash .dynsym .dynstr .gnu.version .gnu. 

ES 本 ec 全 

03 .dynamic .got .got.plt .data 

04 .dynamic 

05 .note.ABI-tag 

06 

可 以 看 到 ， 这 个 ELF 文件 定义 了 从 Type 为 PHDR 的 段 到 Type 为 GNU. STACK 的 段 共 7 个 。 
其 中 ，Type 为 LOAD 的 段 就 是 mmap 系统 调用 加 载 的 段 。 从 上 述 输出 中 可 以 看 到 ， 这 样 的 

段 在 /tmp/showmap 文件 中 定义 了 02、03 这 两 个 ， 并 且 每 一 个 中 都 包含 .text W, .rodata W 


和 .data 155, 
53 virtAddr 栏 的 值 表示 段 被 映射 后 的 地 址 ，Memsiz 栏 的 值 表 示 映 射 目标 的 内 存 空 
间 的 大 小 。offset 栏 的 值 表示 ELF 文件 内 段 的 偏 移 量 ，Pilesiz 栏 的 值 表示 ELF 文件 内 自 
的 大 小 。 也 就 是 说 ，ELF 文件 内 由 偏 移 量 offset 开始 的 Filesiz 长 度 的 文件 范围 被 映射 到 
了 地 址 Virtaddr 开始 的 大 小 为 Memsiz 的 内 存 空间 中 。 这 个 对 应 关系 如 图 20.1 所 示 。 
和 刚才 的 内 存 映 射 相 比 ，/tmp/showmap 被 映射 的 内 存 空间 有 两 部 分 ， 并 且 其 内 存 地 址 、 
大 小 和 上 述 Type 为 LOAD 的 段 属性 几乎 一 致 。 



































之 所 以 说 地 址 、 大 小 “几乎 ”一 致 ， 而 不 是 完全 一 致 ， 是 因为 mmap 系统 调用 映射 的 地 址 、 
大 小 必须 和 地 址 空间 的 内 存 页 对 应 。 在 使 用 ELF 的 i386 FHJ Linux 中 ， 内 存 页 的 大 小 为 4KB， 





因此 映射 到 的 地 址 和 内 存 大 小 都 会 是 4 KB 的 倍数 。 
因此 ， 如 果实 际 映 射 到 的 内 存 地 址 VirtAdqr 不 是 4 KB 的 倍数 ， 就 会 被 替换 成 比 








VirtAddr 小 的 4 KB 的 倍数 中 最 大 的 一 





存 地 址 和 大 小 就 都 变 成 了 4KB 的 倍数 。 





个 。 而 如 果 映 射 到 的 内 存 大 小 Filesiz 不 是 4 KB 的 
倍数 ， 就 会 被 替换 成 比 Filesiz 大 的 4 KB 的 倍数 中 最 小 的 一 个 。 这 


这 样 调整 过 后 ， 映 射 到 的 内 
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虚拟 地 址 空间 


F J Offset 
Pd 加 载 目标 e 
| 内 存 范围 FileSiz 
VirtAddr --4- z ' E 


MemsSiz | 





图 20.1 ELF 段 和 内 存 空间 的 对 应 关系 


和 ELF 文件 不 对 应 的 内 存 空间 


如 前 所 述 ，ELF 文件 中 拥有 实体 的 段 都 是 通过 mmap 系统 调用 来 加 载 的。 不 过 ， 进 程 的 内 
存 空间 中 也 存在 不 和 ELF 文件 对 应 的 部 分 。 这 样 的 内 存 空间 有 以 下 3 种 。 


1. 和 .bss 等 节 对 应 的 空间 

2. 机 器 栈 

3.1€ 

第 1 条 中 的 内 存 空间 对 应 的 是 在 ELF 文件 中 定义 的 、 内 容 没有 写 人 文件 的 节 。 比 如 .bss 
节 在 ELF 文件 中 就 是 一 种 没有 大 小 的 节 。 .bss WE ELF 文件 内 的 数据 大 小 ( Filesiz) 为 0， 
但 加 载 到 内 存 后 ， 也 要 申请 MemSiz 大 小 的 内 存 空 间 。 这 样 的 节 的 内 存 空间 在 对 应 文件 中 没有 

定 ， 但 需要 通过 使 用 了 特别 标志 的 mmap 系统 调用 来 申请 。 

第 2 条 中 的 机 器 栈 的 内 存 空 间 由 Linux 内 核 在 程序 启动 时 分 配 。Linux 上 进程 的 机 器 栈 会 被 
配置 在 内 存 地 址 空间 的 末尾 附近 。 

第 3 条 中 的 堆 (heap) 是 程序 执行 时 申请 的 可 以 变更 的 数据 空间 ， 通 常 被 malloc 函数 用 
于 分 配 内 存 空间 。/proc/ 进程 ID/maps 输出 中 heap 部 分 表示 的 就 是 堆 ， 堆 通常 会 被 分 配 在 
程序 映射 的 内 存 空间 的 后 面 。 
堆 区 在 程序 开始 执行 后 由 brk 这 个 系统 调用 来 分 配 。C 语言 的 程序 在 使 用 malloc 函数 申 
WAF, libe 会 自动 调用 bork 系统 调用 来 申请 堆 的 内 存 范 围 ， 并 从 堆 的 内 存 范围 上 申请 内 存 。 
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不 过 如 果 是 GNU libe 的 话 ， 用 malloc 申请 一 定 大 小 以 上 的 内 存 (2.7 版 本 中 默认 是 128 
KB LA E) 时 ， 不 会 调用 brk 系统 调用 ， 而 会 直接 使 用 mmap 系统 调用 来 申请 内 存 空间 。 


ELF 文件 加 载 的 实现 


代码 清单 20.1 所 示 为 按照 本 节 的 方法 实际 加 载 ELF 文件 的 函数 。 虽 然 这 段 代码 在 错误 处 理 
等 细节 上 做 得 不 够 ， 但 据 此 可 以 确认 这 个 规模 的 代码 就 可 以 实现 ELF 文件 加 载 了 。 
代码 清单 20.1 加载 ELF 文件 的 段 的 函数 


Hdefine ELF EXEC PAGESIZE 4096 
Hdefine PAGEMASK (-(ELF EXEC PAGESIZE - 1)) 
#define EXTEND (addr) (((addr) + (ELF EXEC PAGESIZE - 1)) & PAGEMASK) 




















static void* 
load elf segments(char *path) 
Í 

Elf32 Ehdr eh; 

int fd, i; 


if ((fd = open(path, O RDWR)) < 0) syserr ("open"); 
if (read(fd Nr Sizeof(Elf32 Ehdr)) < 0) syserr("read(Ehdr)"); 
if (lseek(f eh.e phoff, SEEK SET) < 0) syserr("lseek"); 
for (i = 0; i < eh.e phnum; i++) { 
Elf32 Phdr ph; 
if (read(fd, &ph, eh.e phentsize) « 0) syserr("read(Phdr)"); 
if (ph.p type == PT LOAD) { 
void *s beg = (void*) (ph.p vaddr & PAGEMASK); 
void *s end = (void*)EXTEND(ph.p vaddr + ph.p filesz); 
void *z end = (void*)EXTEND(ph.p vaddr + ph.p memsz); 
int prot - PROT READ | PROT WRITE | PROT EXEC; 
int flags - MAP FIXED | MAP PRIVATE; 
off t offset - ph.p offset & PAGEMASK; 
void *addr - mmap(s beg, s end - s beg, prot, flags, fd, offset); 
if (addr -- MAP FAILED) syserr("mmap"); 
if (z end » s end) ( 








addr - mmap(s end, z end - s end, prot, 
flags | MAP ANONYMOUS, 0, 0); 
if (addr -- MAP FAILED) syserr("mmap (zero page)"); 





) 
} 


close (fd); 
return (void*)eh.e_entry; 





另外 ， 如 果 使 用 这 个 函数 来 加 载 真 正 的 ELF 文件 ,mmap 系统 调用 将 会 报错 。 因 为 通常 无 
论 哪个 程序 都 会 加 载 到 同一 个 内 存 地 址 ， 所 以 加 载 程序 的 程序 本 身 的 段 和 被 加 载 的 程序 的 BA 
被 映射 到 同一 段 内 存 空间 上 。 因 此 ， 要 使 用 这 段 函 数 加 载 ELF 文件 ， 就 必须 让 进行 加 载 的 程序 
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的 段 和 被 加 载 的 程序 的 段 的 内 存 地 址 分 离 。 笔 者 通过 在 1d 命令 上 加 上 -Ttext 和 -Tbss 选项 
而 成 功 做 到 了 这 一 点 。 


REG 


4 VDSO 空间 








根据 Linux 的 版 本 的 不 同 ， 有 时 /proc/ 进程 ID/maps 的 输出 中 会 带 有 vdso 这 个 内 存 空间 。 
VDSO 是 Virtual Dynamic Shared Object 的 缩写 ， 是 Linux 内 核 自动 映射 的 内 存 空 间 。 
在 x86 架构 下 ， 根 据 CPU 的 不 同 ， 最 优 的 系统 调用 方法 也 各 有 不 同 ， 因 此 内 核 上 有 一 套 根据 
不 同 的 CPU 来 优化 系统 调用 的 代码 ， 并 在 执行 时 将 其 分 配给 各 个 进程 使 用 。 这 个 内 核 上 准备 的 代 
码 的 内 存 空 间 就 是 VDSO。 






























































本 节 讲 解 动 态 链接 的 程序 从 启动 开始 到 转 和 人 main 函数 处 理 的 过 程 。 
[F3 动态 链接 加 载 器 

上 一 节 讲 解 了 ELF 文件 的 加 载 方法 ， 但 没有 提 及 “是 谁 ” 加 载 了 ELF 文件 。 目 标 文件 的 种 
类 不 同 ， 加 载 ELF 文件 的 主体 也 不 同 。 程 序 由 系统 内 核 加 载 ， 共 享 库 由 动态 链接 加 载 器 加 载 。 

动态 链接 加 载 器 ( dynamic linker / loader ) 是 指 加 载 并 链接 动态 链接 的 程序 本 身 及 其 链接 
的 共享 库 ， 设 置 程序 运行 状态 的 程序 。Linux 上 常用 的 动态 链接 加 载 需 是 /lib/ld-linux. 
so.2。 动态 链接 加 载 器 的 通称 为 19.so， 可 以 通过 man 1d. so 命令 来 显示 帮助 页 。 

使 用 ELF 文件 的 系统 中 ， 程 序 的 ELF 文件 的 INTERP 上 段 需 要 指定 动态 链接 加 载 器 的 路 径 。 


系统 内 核 在 启动 程序 时 读 入 INTER 段 的 内 容 ， 从 而 加 载 、 启 动 程序 。 
换 名 话说， 动态 链接 需 和 动态 链接 加 载 融 的 运作 过 程 并 无 二 致 。 


FI 程序 从 启动 到 终止 的 过 程 
下 面 简单 讲解 一 下 从 1d.so 链接 程序 到 程序 执行 完毕 的 过 程 。 
1. 加 载 程序 
2. 启动 ld.so 
3. 读 入 共享 库 
4. 符号 消解 和 重 定 位 
5 
6 
7 















































. 初始 化 
. 跳 转 到 程序 入 
. 程序 终止 处 理 


首先 系统 内 核 加 载 程序 和 1d.so， 准 备 好 运行 环境 之 后 交 由 ld.so 处 理 。 完 成 启动 的 1d.so 根 
据 系 统 内 核 传递 的 参数 进行 初始 化 。 

接着 读 取 程 序 的 DYNAMIC 段 ， 加 载 所 有 可 执行 文件 链接 的 共享 库 。 对 已 经 加 载 的 共享 库 也 
执行 同样 的 处 理 ， 递 归 地 加 载 所 有 共享 库 。 

一 旦 加 载 完 所 需要 的 库 ， 马 上 消解 所 有 程序 和 库 代 码 中 的 符号 ， 并 重 定位 代码 。 
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T 


这 样 就 完成 了 启动 程序 的 准备 工作 。 在 执行 了 各 个 文件 的 初始 化 代码 后 ， 跳 转 到 程序 人 口 ， 
羊 就 启动 了 程序 。 在 C 语言 程序 中 ， 也 就 是 执行 了 main 函数 的 意思 。 

程序 执行 完毕 后 ， 最 后 会 对 每 个 文件 执行 终止 处 理 ， 这 样 整个 执行 过 程 最 终 完成 。 

FHAA Hello, world! 程序 为 例 ， 来 详细 看 看 程序 执行 的 各 个 阶段 。 


F3 mh ld.so 


把 动态 链接 后 的 程序 路 径 传递 给 execve 系统 调用 后 ， 系 统 内 核 会 把 程序 映射 到 内 存 ， 并 
检测 它 的 INTERP 段 。INTERP 段 是 .interp 节 对 应 的 段 ，. interp 节 的 内 容 就 是 动态 链接 
加 载 器 的 路 径 。 

在 readelf 命令 上 加 上 -1 选项 输出 程序 头 信息 ， 就 可 以 看 到 INTERP 段 的 内 容 。 

















bt 
AX 


























$ readelf -1 hello 
Elf file type is EXEC (Executable file) 
Entry point 0x80482b0 


There are 7 program headers, starting at offset 52 


Program Headers: 


Type Offset VirtAddr PhysAddr FileSiz MemSiz  Flg Align 

PHDR 0x000034 0x08048034 0x08048034 0x000e0 0Ox000e0 R E 0x4 

INTERP 0x000114 0x08048114 0x08048114 0x00013 0x00013 R 0x1 
[Requesting program interpreter: /lib/ld-linux.so.2] 

LOAD 0x000000 0x08048000 0x08048000 0x0049c 0x0049c R E 0x1000 

LOAD 0x00049c 0x0804949c 0x0804949c 0x00104 0x00108 RW 0x1000 








倒数 第 3 行 就 是 INTERP 段 的 内 容 。 由 此 可 以 看 出 ， 本 程序 的 动态 链接 加 载 器 是 /1ip/ 
1d-linux.so.2， 系 统 内 核 会 把 /lib/ld-linux.so.2 映射 到 内 存 中 ， 并 进入 其 启动 人 口 。 

动态 链接 加 载 右 的 入 口 被 记述 在 动态 链接 加 载 絮 本身 的 ELF 头 部 信息 中 。 下 面 让 我 们 为 
readelf 命令 加 上 -h 选项 , 来 显示 /lib/ld-linux.so.2 HJ ELF žE, W FERo 








$ readelf -h /lib/ld-linux.so.2 
ELF Header: 


Magic: 7f 45 4c 46 01 O1 O1 OO OO OO OO 00 OO OO OO 00 
Class: ELF32 

Data: 2's complement, little endian 
Version: 1 (current) 

OS/ABI: UNIX - System V 

ABI Version: 0 

TYPE: DYN (Shared object file) 
Machine: Intel 80386 

Version: 0x1 

Entry point address: 0x7b0 

Start of program headers: 52 (bytes into file) 


倒数 第 2 行 显示 入 口 的 地 址 为 ox7b0，ld.so 的 代码 就 放 在 这 个 地 址 上 。 


F3 系统 内 核 传递 的 信息 








系统 内 核 会 给 动态 链接 加 载 器 传递 如 下 信息 。 


. 命令 行 参数 个 数 ( argc ) 
命令 行 参数 (argv ) 

. 环境 变量 ( envp ) 

ELF 的 AUX 矢量 ( auxv ) 


这 些 信 息 都 放置 在 机 器 栈 中 ， 当 把 处 理 进程 交 给 1d.so 时 ， 其 状态 如 图 20.2 所 示 。 另 外 ,， 初 








和 oM 

















始 化 时 esp 寄存 需 指 向 栈 的 头 地 址 ， 因 此 地 址 0 (sesp) 的 值 就 是 argc. 


O(96esp) 


argv[0] 
argv[1] 


NULL 
envp[0] 


NULL 





图 20.2 ld.so 启动 时 的 栈 状态 


AUX 矢量 














AUX 矢量 (auxiliary vector ) 是 包含 硬件 信息 、 主 程序 的 程序 头 信 息 等 的 数组 。 在 设置 LD_ 





SHOW AUXV 环境 变量 启动 动态 链接 的 命令 后 ， 可 以 让 1d.so 输出 AUX 矢量 。 下 面 我 们 就 利用 
这 个 功能 输出 AUX 矢量 的 内 容 。 





$ LD SHOW AUXV-1 ./hello 


Br 
BP. 





SYSINFO: 0xb7£3b400 
SYSINFO EHDR: Oxffffe000 
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AT HWCAP: 


AT PAGESZ: 
AT CLKTCK: 
AT PHDR: 
AT PHENT: 
AT PHNUM: 
AT BASE: 
AT FLAGS: 
AT ENTRY: 
AT UID: 
AT EUID: 
AT GID: 
AT EGID: 
AT SECURE: 





AT PLATFORM: 


fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov 
pat pse36 clflush dts acpi mmx fxsr sse sse2 ss 


4096 

100 
0x8048034 
E» 

3i 
0xb7£3c000 
0x0 
0x80482b0 
1000 

1000 

1000 

1000 

0 

i686 


在 AUX 矢量 中 ， 主 要 项 目的 含义 如 表 20.4 所 示 。 
表 20.4 AUX 矢量 的 项 目 






































名 称 €x 

AT. HWCAP CPU 的 功能 。 壁 如 如 果 含 有 “fpu”， 则 表示 拥有 浮 点 数 运算 单元 
AT_PAGESZ | 内 存 页 大 小 

AT_PHDR 程序 的 程序 头 起 始 地 址 

AT. PHENT 程序 的 程序 头 大 小 

AT_PHNUM “| 程序 的 程序 头 个 数 

AT_ENTRY 程序 的 入 口 函数 地 址 


























因为 程序 的 ELF 头 已 经 被 系统 内 核 加 载 ， 所 以 这 个 信息 会 


要 再 次 使 用 ld.so EA. ELF $, 


F3 读 入 共享 库 


被 传递 到 AUX 矢量 上 


， 没 有 必 





ld.so 完成 自身 的 初始 化 后 ， 为 开始 动态 链接 人 处理， 需要 处 型 
为 readelf 命令 加 上 -qd 选 


hello 程序 的 DYNAMIC 段 信息 。 


$ readelf -d hello 








程序 的 DYNAMIC Et. 


项 后 ， 就 可 以 输出 ELF 文件 的 DYNAMIC 段 。 下 面 我 们 来 看 看 





Dynamic section at offset 0x4b0 contains 20 entries: 


Tag 
0x00000001 
0x0000000c 
0x0000000d 
0x00000004 
0x00000005 
0x00000006 
0x0000000a 


T 
N 


( 
( 
(F 
(HASH) 
( 
( 
( 


ype 
EEDED) 
y) 











Name/Value 
Shared library: 
0x8048254 
0x8048464 
0x8048148 
0x80481c0 
0x8048170 
74 (bytes) 


[13bc.Bo.6] 


0x0000000b 
0x00000015 
0x00000003 
0x00000002 
0x00000014 
0x00000017 
0x00000011 
0x00000012 
0x00000013 
Ox6ffffffe 
Üxefffffff 
Ox6cffffffO0 
0x00000000 

















VERNEED) 
VERNEEDNUM) 


16 (bytes) 
0x0 
0x804957c 
24 (bytes) 
REL 
0x804823c 
0x8048234 
8 (bytes) 
8 (bytes) 
0x8048214 
1 
0x804820a 
0x0 





ld.so 首先 确认 Type 栏 的 值 为 NEEDED MWAO. Type 栏 为 NEEDED 的 人 人口 就 是 程序 链接 
的 共享 库 的 soname, 1dd 命令 表示 的 库 名 和 DYNAMIC 段 的 NEEDED 入 口 一 致 。 
ld.so 接着 根据 soname 搜索 源 库 。 把 环境 变量 LD DEBUG 设置 为 字符 串 “1ibs” 启 动 程序 





$ LD DEBUG-libs 


4790: 
4790: 
4790: 
4790: 
4790: 
4790: 
4790: 
4790: 
4790: 
( 以 下 省 略 ) 


initialize program: 








./hello 
find library-libc.so.6 [0]; searching 
search cache-/etc/ld.so.cache 

trying file-/lib/tls/i686/cmov/libc.so.6 





后 ， 可 以 输出 ld.so 搜索 库 的 过 程 ， 如 下 所 示 。 


calling init: /lib/tls/i686/cmov/libc.so.6 


./hello 


可 以 看 到 ， 这 里 是 从 缓存 文件 /etc/1d.so.cache 中 加 载 了 /lib/tls/i686/cmov/ 
1ibc.so.6。 这 个 文件 是 特定 平台 下 最 优化 版 本 的 libc。 


成 功 检 索 到 共享 库 后 ， 
如 果 加 载 后 的 共享 
个 共享 库 。 不 过 








"EB DYNAMIC Fy 





符号 消解 和 重 定位 


使 用 上 一 节 提 到 的 方法 (mmap 系统 调用 ) 把 这 个 库 映射 到 内 存 中 。 





PARMAK NEEDED 入 口 的 库 ， 也 要 递归 地 映射 这 


libe 没有 这 样 的 入 口 ， 因 此 上 述 输出 显示 只 有 libe 被 映射 了 。 








共享 库 全 部 映射 完 后 ， 接 下 来 对 程序 


和 所 有 共享 库 的 尚未 消解 的 符号 进行 消解 ， 并 重 定位 


代码 。 把 环境 变量 LD_DEBUG 设置 为 字符 串 “reloc” 局 动 程 序 后 ， 就 可 以 输出 1d.so 的 重 定 


位 过 程 ， 如 下 所 示 。 


$ LD DEBUG-reloc 


4799: 
4799: 


./hello 


relocation processing: /lib/tls/i686/cmov/libc.so.6 (lazy) 
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4799: 

4799: relocation processing: ./hello (lazy) 

4799: 

4799: relocation processing: /lib/ld-linux.so.2 

4799: 

4799: calling init: /lib/tls/i686/cmov/libc.so.6 
( 以 下 省 略 ) 


即 从 库 开 始 按 顺 序 进 行 重 定位 ， 最 后 对 程序 自身 的 代码 进行 重 定位 。 另 外 ，(1azy) 表示 
该 库 中 未 消解 的 符号 将 延迟 到 第 一 次 使 用 时 消解 。 这 一 点 将 在 第 21 章 详 细 讲 述 。 

重 定位 的 执行 顺序 和 映射 到 内 存 上 的 顺序 相反 ， 因 为 后 映射 的 库 〈 的 代码 ) 会 在 先 映射 的 
库 或 者 程序 中 使 用 。 如 果 被 调用 的 代码 的 地 址 不 能 完全 确定 ， 那 么 使 用 这 段 代码 的 代码 就 不 能 
完成 重 定 位 ， 因 此 才 从 后 映射 的 库 开 始 按 顺 序 进行 重 定位 。 

另外 ， 把 环境 变量 LD DEBUG 设置 为 symbols,bindqings， 就 可 以 在 输出 中 显示 未 消解 
的 符号 被 消解 的 过 程 ， 如 下 所 示 。 












































$ LD DEBUG-reloc,libs,symbols,bindings ./hello 2>&1 H -n50 





4830: find library-libc.so.6 [0]; searching 

4830: search cache-/etc/ld.so.cache 

4830: trying file-/lib/tls/i686/cmov/libc.so.6 

4830: 

4830: 

4830: relocation processing: /lib/tls/i686/cmov/libc.so.6 (lazy) 

4830: Symbol= res; lookup in file-./hello 

4830: symbol- res; lookup in file-/lib/tls/i686/cmov/libc.so.6 

4830: binding file /lib/tls/i686/cmov/libc.so.6 to /lib/tls/i686/cmov/ 
libc.so.6: normal symbol ^ res' [GLIBC 2.0] 

4830: symbol- IO file close; lookup in file-./hello 

4830: Symbol- IO file close; lookup in file-/lib/tls/i686/cmov/libc.so.6 

4830: binding file /lib/tls/i686/cmov/libc.so.6 to /lib/tls/i686/cmov/ 
libc.so.6: normal symbol ^ IO file close' [GLIBC 2.0] 

4830: symbol-  morecore; lookup in file-./hello 

4830: symbol-  morecore; lookup in file-/lib/tls/i686/cmov/libc.so.6 

4830: binding file /lib/tls/i686/cmov/libc.so.6 to /lib/tls/i686/cmov/ 
libc.so.6: normal symbol "  morecore' [GLIBC 2.0] 
( 以 下 省 略 ) 


从 这 个 输出 中 可 以 看 到 符号 res 和 IO file close, | morecore 的 消解 过 程 。 


E 运行 初始 化 代码 


经 过 上 述 步 又 ， 程 序 运 行 的 准备 工作 就 已 经 完成 了 。 接 下 来 要 执行 各 个 ELF 文件 中 保存 的 
初始 化 代码 。 

初始 化 代码 在 ELF 文件 的 .init 节 和 .init array 节 中 。.init 节 中 保存 的 是 代码 ， 
而 .init_array 中 保存 的 则 是 用 于 初始 化 的 函数 的 指针 列表 。 通 常 init 节 是 编译 器 提供 的 
库 (crtbegin.o, ME) 中 包含 的 节 。 
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FJ 执行 主 程序 
初始 化 完成 之 后 ， 跳 转 到 程序 的 入口 ， 开 始 执行 程序 。AUX 矢量 中 有 程序 人 口 的 地 址 ， 因 





此 1d.so 可 以 在 不 读 取 ELF 头 的 情况 下 取得 ; 


地 址 。 


$ readelf -h hello 
ELF Header: 


Magic: 
Class: 
Data: 
Version: 
OS/ABI: 
ABI Version: 

Type: 

Machine: 

Version: 

Entry point address: 


Start of program headers: 


( 以 下 省 略 ) 


UEF, hello 程序 的 入 口 为 0x80482b0。 计 我 们 通过 


























这 个 地 址 。 下 面 我 们 就 通过 ELF 头 来 确认 一 下 这 个 


7f 45 4c 46 O1 O1 O1 OO OO OO OO OO OO OO OO OO 


ELF32 

2's complement, 
1 (current) 
UNIX - System V 
0 

EXEC (Executable file) 
Intel 80386 

0x1 

0x80482b0 

52 (bytes into file) 


little endian 











寸 反 汇编 来 看 看 这 个 位 置 有 什么 
































样 的 代码 。 

反 汇 编 ( disassemble ) 指 的 是 从 机 需 码 恢复 到 汇编 代码 的 过 程 。Linux 上 使 用 binutils 包 的 
objdump 命令 就 可 以 反 汇 编 一 个 程序 。 如 下 所 示 ， 为 obj aump 命令 附 上 -a 选项 就 可 以 对 程 
序 进 进 ÍTR do 

$ objdump -d hello 

hello: file format elf32-i1386 

Disassembly of section .init: 

(ees) 

Disassembly of section .text: 

080482b0 « start»: 
80482Db0: 3l eel xor %ebp, Sebp 
80482b2 : 5e pop $esi 
80482b3: gome mov Sesp,$ecx 
80482b5: 83 e4 fO and SOxfffffff0,S$esp 
80482b8: 50 push S$eax 


从 输出 可 以 看 到 ， 作 为 人口 的 地 址 上 定义 了 _start 这 


是 _start KX 
C 语言 中 设 定 程序 从 main 


| Start R 


函数 由 libe 提供 的 /usr/lib/erti.o 文件 定义 ，crt1l.oi 





个 符 


号 。 也 就 是 说 ,程序 的 入 口 就 


函数 开始 执行 ， 但 实际 上 程序 最 初 是 从 | start 函数 开始 执行 的 。 


这 个 文件 在 编译 时 是 默认 链 
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接 的 。_start 函数 会 初始 化 libc， 之 后 调用 main KA F FÆ main 因数 才 会 被 执行 。 


执行 终止 处 理 


接 下 来 从 main KÄORE, E 1d.so 会 执行 终止 处 理 的 代码 。 用 于 初始 化 的 有 . init 节 
和 .init_array 节 ， 相 应 地 ， 终 止 处 理 有 .fini WH .fini_array Wo .fini 节 保 存 进 
但 终止 时 执行 的 代码 ,而 . fini array 节 则 保存 进程 终止 时 执行 的 函数 指针 列表 。 

程序 执行 完毕 后 ，1d.so 会 调用 exit 系统 调用 终止 进程 。exit 系统 调用 和 平时 使 用 的 
exit 国 数 不 同 。C 语言 程序 调用 exit 系统 调用 时 ， 调 用 的 是 exit KZ 

exit PÁZIGAT libe 的 终止 处 理 的 代码 ( .fini 节 和 .fini array 节 ) 后 ,执行 exit 
系统 调用 结束 进程 。 而 exit 系统 调用 会 跳 过 终止 处 理 ， 立 即 结束 进程 。 

以 上 就 是 ld.so 所 有 的 处 理 过 程 





























o 


ld.so 解析 的 环境 变量 


在 本 节 的 最 后 ， 为 大 家 列举 几 个 对 1d.so 的 运行 有 用 的 环境 变量 。 想 要 更 深入 地 理解 应 用 
ld.so 时 ， 可 拿 来 参考 。 


表 20.5 ld.so 识别 的 环境 变量 (glibc 2.7 ) 








































































































































































































































































































































































































环境 变量 EN 

LD_AUDIT 指定 介入 并 监督 共享 库 链 接 过 程 的 目标 文件 

LD_BIND_NOT 禁止 ld.so 的 符号 消解 

LD BIND. NOW 不 延迟 符号 消解 ， 在 进程 开始 时 消解 所 有 符号 

LD_DEBUG 指定 调试 标志 。 可 用 的 标志 如 表 20.6 所 示 

LD_DEBUG_OUTPUT 调试 信息 输出 的 目标 文件 

LD_DYNAMIC_WEAK ld.so 进行 符号 消解 时 也 使 用 weak 符号 

LD_HWCAP_MASK 指定 加 载 共 享 库 时 使 用 的 功能 集 

LD_LIBRARY_PATH 共享 库 的 检索 路 径 冒号 分 割 ， 比 如 “path:path:path” ) 

LD_ORIGIN_PATH EXE rpath 中 表示 二 进 制 文件 路 径 的 变量 SORIGIN 的 值 

LD_PRELOAD 指定 和 NEEDED 入 口 无 关 的 最 初 加 载 的 库 

LD_POINTER_GUARD 开启 或 者 关闭 针对 函数 指针 的 攻击 的 防护 功能 。0 代表 关闭 ， 除 此 以 外 为 
开启 

LD SHOW. AUXV 指定 非 空 字符 串 时 显示 AUX 矢量 

LD_TRACE_PRELINKING | 输出 预 链接 过 程 

LD_TRACE_LOADED_OB- | 表示 加 载 的 共享 库 。 和 ldd 的 输出 一 致 

JECTS 

LD_VERBOSE 指定 非 空 字符 串 时 输出 符号 的 版 本 情况 

LD_WARN 表示 警告 的 级 别 。 指 定 长 度 大 于 等 于 1 的 字符 串 时 开启 警告 


























其 中 ， 环 境 变 量 LD_DEBUG 可 以 指定 的 值 如 表 20.6 所 示 ， 当 有 多 个 时 ， 用 逗号 分 割 。 


表 20.6 ”环境 变量 LD_DEBUG 可 以 指定 的 值 










































































































































































标志 含义 

libs 表示 搜索 共享 库 相 关 的 信息 

reloc 表示 重 定位 相关 的 信息 

files 表示 共享 库 的 头 信息 

symbols 表示 符号 表格 操作 相关 的 信息 

bindings 表示 与 未 消解 符号 的 消解 相关 的 信息 

versions 表示 符号 版 本 相关 的 信息 

all 与 “libs,reloc,files,symbols,bindings,versions” 一 致 
statistics 表示 重 定 位 的 统计 信息 

unused 表示 未 使 用 的 共享 库 

help 表示 LD_DEBUG 可 指定 的 参数 相关 的 帮助 信息 
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动态 加 载 








本 节 来 讲解 在 程序 执行 时 进行 所 有 链接 操作 的 “动态 加 载 ”。 


所 谓 动 态 加 载 


动态 加 载 (dynamic load ) 指 的 是 在 程序 运行 时 指定 共享 库 名 称 进行 加 载 的 方法 。 动 态 加 载 
经 常 被 用 于 实现 所 谓 的 插件 (plugin), Linux 中 使 用 dlopen () 函数 进行 动态 加 载 。 




















F Linux 下 的 动态 加 载 
Linux 下 使 用 以 dlopen 为 代表 的 API 集合 进行 动态 加 载 ， 有 具体 来 说 有 以 下 3 个 。 


€ dlopen(3) 

9 dlsym(3) 

9 dlclose(3) 

代码 清单 20.2 所 示 为 使 用 dlopen 调用 函数 的 Cb 程序 的 例子 。 
代码 清单 20.2 ”使 用 动态 加 载 调用 printf 的 Cb 程序 


import dilfcn; 











( dynhello.cb ) 


typedef int (char *, ...)* printf t; 


int 

main(int argc, char** argv) 

{ 
void* lib = dlopen("libc.so.6", RTLD LAZY); 
printf t f - dlsym(lib, "printf"); 
f("Hello, World!Wn"); 
dlclose (lib); 
return 0; 


因为 大 多 数 情况 下 加 载 库 后 会 一 直 使 用 ， 直 到 进程 结束 ， 所 以 不 用 alclose 函数 的 情况 也 
很 多 。 
如 下 所 示 ， 使 用 cbe 命令 可 以 编译 dynhello.cb. 
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$ cbc dynhello.cb -1dl 


-1d1 指 的 是 链接 时 指定 dl 库 。Linux 下 正 是 这 个 库 提 供 了 dlopen 等 代码 ， 因 此 如 果 要 实 
现 动 态 加 载 ， 必 须 链 接 dl 库 。 


F 动态 加 载 的 架构 


下 面 简单 讲解 aLopen 函数 的 实现 。 

动态 链接 的 程序 最 初 一 定 已 经 加 载 了 ld.so， 而 程序 启动 之 后 1d.so 的 代码 依然 存留 在 内 存 
上 。 因 此 只 需 调 用 内 存 中 1d.so 的 代码 ， 就 可 以 在 程序 开始 执行 后 也 能 进行 动态 链接 的 处 理 。 

K 20.7 所 示 为 glibc 的 源 代码 中 alopen 函数 的 调用 图 。 不 过 这 并 不 是 完整 的 调用 图 ， 而 
是 只 截取 了 其 中 负责 主要 流程 的 函数 ， 并 且 从 上 往 下 表示 调用 关系 。 


表 20.7 dlopen 函数 的 调用 图 




























































































































































































文件 函数 说 明 

dlfcn/dlopen.c dlopen 提供 面向 用 户 的 # 

dlfcn/dlopen.c __dlopen 

dlfcn/dlopen.c _dlopen_doit 

elf/dl-open.c dl_open 加 载 目 标 文件 ， 调 用 初始 化 代码 和 文本 
elf/dl-open.c dl open worker 

elf/dl-load.c . dl map. object 决 射 ELF 文件 的 段 

elf/dl-load.c dl. map. object. from. fd 利用 mmap 从 已 打开 的 文件 映射 段 



































最 后 的 _dql map object from fd 就 是 实际 使 用 mmap 系统 调用 加 载 库 的 函数 。 加 载 的 
库 的 ELF 头 和 DYNRAMIC 段 的 内 容 都 保存 在 link map 结构 体内 ， 各 个 库 的 link map 结构 体 
都 可 以 在 全 局 变量 rtld global 的 _ al _ns 成 员 中 访问 。 请 注意 在 代码 中 ,访问 _al_ns 
成 员 时 一 般 会 使 用 GL 宏 访 问 ， 比 如 GL (al ns)。dqlopen KXOR EIH void» 类 型 的 值 也 是 
指向 struct link map 的 指针 。 

另外 ，struct link_map Ý include/link.h Ñ elf/link.h 两 个 文件 中 都 有 定义 ， 

结构 体 的 成 员 数 不 一 致 。include/1ink.h 是 glibc 内 部 使 用 的 版 本 ， 其 成 员 数 较 多 一 
阅读 代码 时 可 以 参考 这 个 文件 的 定义 。 
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GNU Id 的 链接 














作为 实现 cbe 的 链接 功能 的 准备 工作 ， 这 里 首先 讲解 一 下 直接 使 用 GNU Id 链接 目标 文件 的 


方法 。 








用 于 cbc 的 Id 选项 的 结构 

















上 一 章 中 介绍 了 对 gee 使 用 -v 选项 来 输出 gcc 内 部 执行 的 命令 的 方法 ， 本 节 让 我 们 再 深入 
了 解 一 下 。 为 gee 加 上 -v 选项 执行 链接 时 collect2 命令 的 参数 如 下 所 示 。 











/usr/lib/gcc/i486-linux-gnu/4.1.2/collect2 \ 
--eh-frame-hdr \ 
-m eg 3988 W 
-dynamic-linker /lib/ld-linux.so.2 \ 
-o prog \ 
Mer B US oy Ao oTov eG Ib e Ub ento ) ax oU ee a [B VEU o Aot t o MON 
/usr/lib/gcc/i486-linux-gnu/4.1.2/../../../../Llib/erti.o N 
/usr/lib/gcc/i486-linux-gnu/4.1.2/crtbegin.o \ 


L/usr/lib/gcc/i486-linux-gnu/4.1.2 \ 
L/usr/lib/gcc/i486-linux-gnu/4.1.2 \ 
L/usr/lib/gcc/i486-linux-gnu/4.1.2/../../../../lib N 
yao c Mate; N 





Jy big le ee Ww 


main.o f.o X 

goo oc needede logecemse no os neededey 

-lc N 

-lgcc --as-needed -lgcc s --no-as-needed \ 
/usr/lib/gcc/i486-linux-gnu/4.1.2/crtend.o \ 
/usr/lib/gcc/i486-linux-gnu/4.1.2/../../../../L1ib/crtn.o 


为 了 增强 易 读 性 ， 上 述 输出 中 根据 意思 添加 了 换行 符 。 下 面 我 们 删除 gcc 特有 的 参数 和 不 
必要 的 参数 。 

首先 ， 由 于 collect2 命令 是 gcc 用 的 链接 器 ， 因 此 可 以 换 成 /usr/bin/ld. 

其 次 ，- -eh-frame-hdr 选项 是 用 来 处 理 C++ 异常 的 ， 而 cbe 中 不 处 理 异常 ， 因 此 不 需 
要 这 个 选项 。 


-m 














elf i386 是 用 来 指定 输出 的 目标 文件 的 格式 的 ， 其 指定 的 elf_i386 格式 和 GNU Id 


的 默认 格式 一 致 ， 因 此 可 以 省 略 。 


从 这 里 开始 快 进 一 下 ， 看 看 出 现 了 两 次 的 -lgcc - -as-needed…… 选 项 。 这 个 选项 链接 
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的 libgcc 是 gcc 提供 的 构造 函数 等 的 库 ， 对 cbe 而 言 没 有 作用 ， 因 此 我 们 也 删除 这 个 选项 。 

如 果 不 用 链接 gcc 专用 的 库 ， 那 么 -L/usr/lib/gcc/i486-linux-9nu/4.1.2 Km 

然后 ,“. ./../../” 这 种 指定 路 径 的 方式 很 麻烦 ， ee "ue dos iia 2 
外 ， 将 同一 个 路 径 多 次 指定 到 -E 选项 也 是 徒劳 ， 因 此 删除 重复 的 - 选项 。 最 后 ，-LV/ILiDb 
和 -L/usr/lib Æ ld 默认 的 库 检 索 路 径 ， 因 此 也 可 以 省 略 。 

综 上 ， 我 们 可 以 将 参数 简化 成 下 面 这 样 。 


/usr/bin/ld N 
-dynamic-linker /lib/ld-linux.so.2 \ 
-o prog \ 
wus/ a /ent lonN 
全 可 WE 
/usr/lib/gcc/i486-linux-gnu/4.1.2/crtbegin.o \ 
madn.o f.o X 
-lc AN 
/usr/lib/gcc/i486-linux-gnu/4.1.2/crtend.o \ 
(usr le en 


FJ C 运行 时 
简化 后 的 参数 中 cre~ 这 样 的 文件 非常 多 。crt 是 C runtime 的 略 写 ，crt~ 这 样 的 文件 都 是 
包含 C 语言 程序 初始 化 和 终止 处 理 的 代码 的 目标 文件 。 
这 其 中 ，/usr/1ib 下 的 crt~ 是 glibc 的 文件 ，/usr/1ib/gcc 下 的 crt~ 则 是 gcc 的 文 
件 。 表 20.8 中 总 结 了 C 运行 时 文件 的 作用 。 


R 20.8 C 运行 时 文件 的 作用 





































































































文件 提供 方 作用 

crt1.0 libc 对 argc 和 argv 进行 初始 化 。 定 义 了 | start 函数 
crti.o libc 配置 到 .init 节 ， 进 行 libc 的 初始 化 

crtn.o libc 配置 到 .fini 节 ， 进 行 libc 的 终止 处 理 

crtbegin.o gcc 搜索 C++ 构造 函数 或 者 constructor 属性 的 函数 
crtend.o gcc 搜索 C++ 析 构 函数 或 者 destructor 属性 的 函数 











Cb 中 没有 构造 函数 也 没有 析 构 函数 ， 因 此 gcc 提供 的 crtbegin.o 和 crtend.o 也 是 多 
余 的 。 

到 此 为 止 ， 我们 已 经 删除 了 所 有 cbe 不 需要 的 参数 。 下 面试 试看 用 剩 下 的 命令 行 参 数 直 接 
执行 一 下 。 











$ yfusr/bin/Id X 
-dynamic-linker /lib/ld-linux.so.2 \ 
-o prog \ 
/usr/lib/crtl1.o VN 
/usr/lib/erti.o X 
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main.o f.o -lc \ 
/usr/lib/crtn.o 

$ ./prog 
£(5)z25 


像 这 样 ， 链 接 后 的 程序 可 以 正常 运作 。 


生成 可 执行 文件 














一 般 来 说 ， 为 了 把 Cb fÉFFHLA 
使 用 1a 命令 。 


$ /usr/bin/ld VN 
-dynamic-linker /lib/ld-linux.so.2 \ 


/usr/lib/crtl.o NV 
/usr/lib/crti.o NV 

-L 选项 等 在 命令 行 中 指定 的 参数 \ 
iD 令 行 参数 指定 的 目标 文件 \ 
CN 

Ice 

/usr/lib/crtn.o \ 

-0 输出 文件 名 











请 注意 这 里 加 上 了 -lcbc 选项。 
函数 ， 并 且 包 含 处 理 可 变 长 度 参数 等 所 需 的 函数 。 


-dynamic-linker /lib/1ld-linux.so.2 是 





alloca R 
另外 ， 
指定 的 路 径 会 被 加 入 到 


F3 生成 共享 库 





.interp 节 中 。 


libcbc 是 cbe 提供 的 静态 库 ， 实 现 了 第 16 Se rp 














站 定 动态 链接 加 载 右 的 选项 。 





后 的 重 定位 文件 链接 起 来 生成 可 执行 文件 ， 可 以 像 下 面 一 样 


解 的 


这 里 





接 下 来 ,为 了 链接 Cb 程序 
下 所 示 。 


汇编 后 和 





$ /usr/bin/ld NV 
-shared \ 
/usr/lib/crti.o WV 
-L 选项 等 在 命令 行 中 指定 的 参数 \ 
i 令 行 参数 指定 的 目标 文件 \ 
-lc \ 
-lcbc \ 
/usr/lib/crtn.o N 
-0 输出 文件 名 


该 命令 和 生成 可 执行 文件 的 命令 有 3 点 不 同 。 


1. 追加 了 -shared 选项 





导 到 的 重 定位 文件 来 生成 共享 库 ， 





我 们 使 用 1d 命令 


， 如 
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2. 去 掉 了 -dynamic-linker /lib/ld-linux.so.2 选项 
3. 不 链接 /usr/lib/crti1.o 

















ld 命令 的 -shared 选项 和 gcc 的 -shared 选 项 的 意思 完全 一 致 。 要 生成 共享 库 ， 就 一 


定 要 配置 这 个 选项 。 
Ah, -dynamic-linker /lib/ld-linux.so.2 这 个 选项 对 共享 请 


EFE 来 说 不 是 必需 的 。 








因为 共享 库 是 被 加 载 的 一 方 ， 所 以 不 需要 特意 指定 动态 链接 加 载 器 。 

最 后 生成 共享 库 的 时 候 不 需要 链接 crt1.o。crt1.o 是 启动 程序 的 代码 
享 库 没 有 关系 。 

下 一 章 我 们 将 讲解 和 共享 库 关 系 密切 的 地 址 无 关 代 码 。 




















， 和 没有 入 口 的 共 









生成 地 址 无 关 代码 


本 章 将 讲解 地 址 无 关 代 码 的 相关 内 容 ， 并 在 cbc 
中 实现 生成 地 址 无 关 代码 的 功能 ， 这 样 cbc 中 所 


有 的 功能 就 都 实现 了 。 
C c N 
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NN 
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( 地 址 无 关 代码 





本 他 将 讲解 和 动态 链接 关系 紧密 的 地 址 无 关 代码 的 相关 内 容 。 


F3 什么 是 地 址 无 关 代 码 


地 址 无 关 代 码 ( Position Independent Code, PIC ) 指 的 是 无 论 加 载 到 哪个 地 址 ， 都 不 需要 重 
定位 也 能 运行 的 代码 。 共 享 库 的 代码 一 定 要 是 地 址 无 关 代 码 ， 这 一 点 很 重要 。 至 于 为 什么 共享 
库 一 定 要 设置 为 地 址 无 关 代 码 ， 是 为 了 实现 库 的 共享 。 

我 们 在 第 20 章 中 提 到 过 共享 库 使 用 mmap 系统 调用 来 加 载 。 而 如 果 mmap 系统 调用 使 用 了 
MAP PRIVATE 标志 来 加 载 ， 那 么 只 要 映射 后 的 内 存 页 内 容 不 变更 ， 全 进程 就 共用 一 个 内 存 页 。 

共享 内 存 页 的 构造 如 图 21.1 所 示 。 通 过 将 物理 地 址 空间 上 仅 有 的 一 个 内 存 空 间 映 射 到 多 个 
进程 ， 就 可 以 实际 只 消耗 这 一 个 内 存 空间 。 


虚拟 地 址 空间 物理 地 址 空间 
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211 共享 内 存 页 


不 过 ,在 这 样 的 构造 下 ， 也 就 只 有 在 映射 后 的 内 存 内 容 没 有 变更 的 时 候 可 以 共享 内 存 。 如 图 
21.2 所 示 ， 如 果 进 程 更 改 了 内 存 内 容 ， 内 存 空间 就 会 被 复制 ， 这 时 就 无 法 再 继续 共享 内 存 了 。 

如 果 非 地 址 无 关 代 码 使 用 了 全 局 变量 或 者 非 static 函数 ， 就 会 发 生 重 定 位 。 重 定位 一 旦 
发 生 ， 就 会 向 内 存 中 写 人 数据 ， 导 致 无 法 继续 共享 内 存 。 如 果 所 有 的 进程 都 发 生 重 定位 ， 那 么 
共享 库 在 内 存 上 就 完全 没有 被 共享 了 。 
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虚拟 地 址 空间 物理 地 址 空间 
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图 21.2 ”内 存 数据 变更 后 无 法 继续 共享 


一 旦 无 法 共享 内 存 镜像 ， 使 用 共享 库 的 意义 就 会 大 大 降低 ， 因 此 把 共享 库 的 代码 设置 成 不 
会 发 生 重 定位 的 地 址 无 关 代码 是 非常 重要 的 。 


后 全 局 偏 移 表 (GOT) 


要 生成 地 址 无 关 代码 ， 必 须 改 变 两 点 : 一 是 全 局 变量 的 访问 ， 二 是 外 部 函数 的 调用 。 

先 从 访问 全 局 变量 的 代码 说 起 。 通 常 访问 全 局 变量 时 会 生成 直接 使 用 变量 的 绝对 地 址 的 代 
码 ， 不 过 代码 使 用 绝对 地 址 的 话 就 不 再 是 “地 址 无 关 ” 的 了 ， 因 此 一 定 要 把 绝对 地 址 改 为 相对 
地 址 。 

于 是 可 以 使 用 一 种 名 为 全 局 偏 移 表 (Global Offset Table, GOT ) 的 结构 。GOT 是 指向 全 局 
变量 的 指针 的 数组 ， 链 接 器 为 其 申请 内 存 空间 ， 动 态 链接 加 载 句 则 初始 化 其 内 容 。 地 址 无 关 代 
码 就 是 通过 从 这 个 GOT 中 读 取 地 址 而 做 到 地 址 无 关 的 。 


F3 获取 GOT 地 址 


在 使 用 GOT 的 时 候 ， 关 键 是 如 何 获取 GOT 自身 的 地 址 。 如 果 得 到 的 GOT 本 身 的 地 址 是 绝 
对 地 址 ， 那 么 就 不 能 做 到 地 址 无 关 。 因 此 ,使 用 ELF 的 LA-32 的 系统 中 会 通过 各 种 巧妙 的 代码 
来 获取 GOT 的 地 址 。 

这 里 介绍 一 下 gcc 中 使 用 的 方法 。gcc 中 用 来 获取 GOT 地 址 的 代码 如 下 所 示 。 






















































































call . i686.get pc thunk.bx 
addl $ GLOBAL OFFSET TABLE , $ebx 
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. i686.get pc thunk.bx: 
movil (Sesp), $ebx 
mer 


首先 ， 通 过 调用 i1686.get pc thunk.bx KX, JE F—^- adal 命令 的 地 址 取出 到 
ebx ATAY o 

call 命令 把 下 一 命令 的 地 址 压 栈 ， 并 跳 转 到 指定 标签 。 因 此 ,在 call 指令 执行 后 ， 把 栈 
顶 的 值 取出 ， 就 可 以 得 到 call 命令 之 后 的 命令 的 地 址 。 

接 下 来 的 一 行 中 使 用 了 GLOBAL _OFFSET _TABLE 这 个 特别 的 符号 ， 把 GOT 的 地 址 加 到 
ebx 寄存 需 中 。 

. GLOBAL OFFSET TABLE 表示 GOT 和 其 所 在 的 指令 地 址 的 相对 偏 移 量 ， 让 我 们 结合 图 
21.3 来 看 一 下 。 


























call _i686.get_pc_thunk.bx 
CD96ebx-;- 
addl $ GLOBAL. OFFSET. TABLE , 96ebx 


(2$ GLOBAL OFFSET TABLE - 


GOT 的 地 址 = 中 + 人 @) 


图 21.3 GOT 的 地 址 和 GLOBAL OFFSET TABLE 


每 个 目标 文件 都 会 生成 一 份 GOT， 并 存储 在 .got 节 中 。 内 存 上 .text 节 和 .got WIJHE 
离 通 常 是 固定 的 ， 因 此 可 以 在 链接 时 (build 时 ) 计算 GLOBAL OFFSET TABLE 的 值 。 

也 就 是 说 , 在 从 1i686.get_ pc thunk.bx KGR, aaal 命令 的 (绝对 ) 地 址 保 
存在 ebx 寄存 器 中 ， 因 此 使 用 _GLOBAL OFFSET TABLE 符号 就 可 以 得 到 GOT 和 addl 命令 
之 间 的 距离 。 

地 址 无 关 代码 中 每 一 个 函数 都 需要 使 用 上 述 代 码 得 到 GOT 的 地 址 ， 并 由 GOT 得 到 变量 的 
地 址 。 


使 用 GOT 地 址 访问 全 局 变量 


接 下 来 讲解 使 用 GOT 访问 全 局 变量 的 方法 。 
首先 ， 访问 非 地 址 无 关 的 全 局 变量 的 代码 如 下 所 示 。 本 例 中 把 stdout 的 值 传人 了 eax 寄 
存 器 。 
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movil stdout, $eax 


另 一 方面 ， 访 问 地 址 无 关 的 全 局 变量 的 代码 如 下 所 示 。 这 里 假设 已 经 通过 上 述 代码 把 GOT 
的 地 址 存 人 了 ebx 寄存 带 中 。 





movl stdout@GOT ($ebx), %eax 
movl (Seax), %šeax 





stdouteGoT 中 的 @GOT 是 地 址 无 关 代码 专用 的 符号 ， 表 示 stdout 对 应 的 GOT 入 口 在 
GOT 内 的 偏 移 量 。 这 个 符号 在 链接 时 会 重 定位 ， 并 在 加 载 前 确定 具体 的 值 。 

因为 我 们 假设 ebx 寄存 器 中 已 经 存 人 了 GOT 的 地 址 ， 所 以 在 GOT 的 地 址 sebx 的 基础 上 
加 上 GOT 内 的 偏 移 量 stdqouteGoT， 就 可 以 得 到 GOT ÀH KJE. GOT 入 口 的 值 也 就 是 全 局 变 
量 的 地 址 ， 再 次 引用 这 个 地 址 ， 就 可 以 得 到 全 局 变量 的 值 。 


访问 使 用 GOT 地 址 的 文件 内 部 的 全 局 变量 


I 刚 讲解 的 由 GOT 得 到 全 局 变量 的 地 址 的 方法 可 以 适用 于 所 有 的 全 局 变量 。 不 过 ， 如 果 是 
同一 个 文件 内 定义 的 静态 全 局 变量 ， 那 么 不 仅仅 是 变量 地 址 ， 变 量 本 身 也 可 以 访问 到 。 
通过 下 述 代 人 码 可 以 访问 地 址 无 关 代 码 中 静态 全 局 变量 gvar 的 值 。 这 里 也 假设 ebx 寄存 器 
中 已 经 保存 了 GOT miu. 





























ag 
































movil gvarGGOTOFF($ebx), $eax 





gvarGGOTOFF 中 的 egoTOFF 符号 表示 从 GOT 到 全 局 变量 实体 的 偏 移 量 。 这 个 符号 会 在 
链接 时 被 消解 。 

另外 ， 使 用 这 个 方法 访问 的 变量 并 不 一 定 在 GOT 上， 这 里 只 是 为 了 获取 其 绝对 地 址 而 借用 
了 一 下 GOT 的 地 址 而 已 。 


过 程 链接 表 (PLT) 

接 下 来 讲解 外 部 函数 如 何 调用 地 址 无 关 代 码 。 

Linux 下 为 了 使 函数 调用 地 址 独立 ,使 用 了 一 种 可 以 称 之 为 GOT 的 函数 版 的 方法 一 一 过 程 
链接 表 (Procedure Linkage Table, PLT )。 不 过 PLT 一 般 比 GOT 的 入 口 数 多 ， 因 此 会 采取 延迟 
初始 化 ( lazy initialization )。 也 就 是 说 ， 外 部 函数 第 一 次 调用 该 函数 时 ， 该 函数 才 会 被 链接 。 

PLT 的 代码 如 下 所 示 。 














PrnYTIO]: 
pushl GOT [1] 
jmp GOT [2] 








PLT[1]: 
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jmp GOT [m+1] 
pushl ”入 口 的 偏 移 量 
jmp PLT[0] 

PLT [n]: 
jmp GOT [m+n] 
pushl ”入 口 的 偏 移 量 
jmp PLT [0] 

PLT [n1]: 
jmp GOT [m+n+1] 
pushl ”入 口 的 偏 移 量 
jmp PLT[0] 





代码 中 的 PLT [n] 指 的 是 PLT 的 第 n 4 AH 4 GoT [0] 表示 的 是 GOT 最 开始 的 4 字 节 的 
值 ，GoT [1] 表示 的 是 接 下 来 的 4 字 节 的 值 。 

现在 假设 printf 函数 对 应 的 PLT 的 人 人 口 为 PLT [n] 。 这 时 如 果 调 用 printf 函数 ， 则 不 
会 跳 转 到 printf 函数 本 身 ， 而 是 跳 转 到 PLT [n] 的 代码 中 。 

PLT 的 处 理 中 加 入 了 跳 转 的 逻辑 ， 相 对 比较 复 林 ， 让 我 们 结合 图 21.4 来 看 一 下 。 





PLTIO]: 
pushl GOTI1] 


jmp GOTI[2] 


jmp GOT[m«n] < F 1d.so 链接 的 函数 


pushl 入 口 的 偏 移 量 


jmp PLTIO] 







































































图 21.4 PLT 的 控制 流程 ( 链接 前 ) 


跳 转 到 PLT [n] 的 代码 后 ， 首 先 执 行 的 是 jmp COT [m+n] ， 也 就 是 跳 转 到 PLT [n] 对 应 
的 GOT 入 口中 保存 的 地 址 。“PLT [n] 对 应 的 GOT 入 口中 保存 的 地 址 ”默认 是 PLT [n] 的 第 
2 条 指令 ， 即 push 指令 的 地 址 。 直 接 执行 push 指令 ， 接 着 jmp 指令 就 会 被 执行 ， 并 跳 转 到 
PLT [0] 。 

PLT [0] 中 把 GOT 的 第 2 MEJE, JÍT jmp 指令 跳 转 到 GoT [2] ， 也 就 是 GOT 的 第 
3 个 人口 中 保存 的 地 址 。GoT [2] 上 设置 了 执行 1d.so 链接 的 函数 的 指针 。 这 个 包含 了 1d.so f) PR 
数 会 从 库 检 索 printf 等 函数 的 地 址 ， 把 真正 的 地 址 设置 到 GOT [m+n] E. 
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像 这 样 变更 了 GOT [men] 之 后 ， 接 下 来 跳 转 逻 辑 就 会 变 成 如 图 21.5 所 示 的 样子 。 


PLTI[O]: 
pushl GOTI1] 
jmp GOTI[2] 








jmp GOTIm+n] © F ld.so 链接 的 函数 


pushl 入 口 的 偏 移 量 


jmp PLTIO] 
























































外 部 函数 体 
9 


图 21.5 PLT 的 控制 流程 ( 链接 后 ) 
可 以 看 到 在 完成 最 开始 的 链接 之 后 ， 多 余 的 跳 转 只 有 一 次 。 


调用 PLT 入 口 


要 从 汇编 语言 的 代码 经 由 PLT 调用 函数 ， 可 以 在 函数 的 符号 后 加 上 @PLT， 如 下 所 示 。 








ceaun printf@PLT 





printf@PLT 是 展开 PLT 中 保存 的 printf 国 数 入 口 的 相对 地 址 的 符号 。 和 GOT 一样， 
一 个 目标 文件 对 应 一 个 PLT。 从 .text 节 到 PLT 的 相对 地 址 也 是 在 链接 时 确认 的 。 
PLT 的 结构 相对 比较 复杂 ， 不 过 使 用 PLT 的 代码 反而 比较 容易 生成 。 


F3 地 址 无 关 的 可 执行 文件 : PIE 


在 本 节 的 最 后 ， 我 们 来 讲解 一 下 地 址 无 关 的 可 执行 文件 。 

所 谓 地 址 无 关 的 可 执行 文件 (Position Independent Executable, PIE )， 顾 名 思 义 ， 指 的 是 使 
用 地 址 无 关 代 码 的 可 执行 文件 。 因 为 地 址 无 关 ， 所 以 可 以 被 加 载 到 任意 地 址 。 

比如 用 gce 生成 PIE 时 ， 需 要 像 下 面 这 样 加 上 -fPIE 选项 进行 编译 ， 加 上 -pie 选项 进行 
链接 。 



































$ gcc -c -fPIE hello.c 
$ gcc -pie hello.o -o pie-hello 
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cbc 中 也 实现 了 几乎 一 样 的 选项 ， 因 此 也 同样 可 以 生成 PIE。 

将 共享 库 的 代码 设 成 地 址 无 关 代 码 的 原因 是 让 共享 库 在 内 存 上 共享 。 但 PIE 不 一 样 ，PIE 
的 目标 是 使 得 加 载 后 的 地 址 每 次 都 不 一 样 ， 据 此 来 提高 安全 性 。 

事实 上， 电脑 病毒 或 者 蠕虫 在 很 多 情况 下 都 是 因为 程序 在 特定 地 址 加 载 而 产生 的 。 利 用 
PIE 可 以 使 得 程序 每 次 被 加 载 到 随机 的 地 址 上 ， 从 而 大 大 提高 程序 的 安全 性 。 

PIE 的 实现 和 普通 的 地 址 无 关 代 码 几乎 一 样 。 访 问 全 局 变量 时 使 用 GOT， 调 用 全 局 孔 数 时 
使 用 PLT。 不 过 ， 在 访问 同一 个 文件 内 定义 的 全 局 变量 时 ， 无 论 是 不 是 静态 变量 ， 都 用 
eGOTOFF 符号 直接 访问 实体 。 

另外 ， 链 接 PIE 时 需要 为 /usr/bin/1d 附 上 -pie 选项， 这 个 选项 就 被 用 于 生成 PIE 
文件 。 

最 后 ,通常 crt1.o 文件 不 是 地 址 无 关 的 ， 为 了 使 得 程序 整体 地 址 无 关 ， 需 要 使 用 crt1.o 
的 PIE 专用 的 文件 。 这 个 PIE 专用 的 crti.o 的 文件 名 为 Scrt1 .o。 

下 一 节 我 们 将 在 cbe 中 实现 生成 地 址 无 关 代 码 的 功能 。 

o GOT 写 入 攻击 和 只 读 GOT 
























































GOT 为 程序 灵活 地 提供 了 地 址 无 关 特 性 ， 但 存在 安全 方面 的 问题 。GOT 中 包含 PLT 使 用 的 函 
JG, ERA printf, fputs 等 频繁 使 用 的 函数 的 指针 ， 并 且 是 可 写 的 。 因 此 如 果 通 过 某 种 手 
BRAS GOT 中 的 某 一 段 ， 就 可 能 从 程序 处 理 流 程 跳 转 到 任意 地 址 去 。 这 样 的 攻击 手法 称 为 GOT S 
入 攻击 ( GOT overwrite attack )。 

为 防止 GOT 写 入 攻击 ， 可 以 采用 把 GOT 设置 为 只 读 的 方法 。 实 现 起 来 也 很 简单 ， 取消 ld.so 
对 GOT 的 延迟 初始 化 ， 在 程序 开始 执行 时 消解 所 有 符号 ， 执 行 mprotect 系统 调用 把 GOT 的 内 存 
空间 设置 为 不 可 写 。 

为 1d 命令 附 上 -z combreloc -z now -z relro 选项 可 以 生成 只 读 GOT。cbc 使 
用 --readonly-got 选项 后 可 以 把 上 述 选 项 传 给 1d 命令 ， 非 常 简单 ， 大 家 可 以 试 一 试 。 
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全 局 变量 引用 的 实现 








本 节 将 讲解 如 何 生成 引用 全 局 变量 的 地 址 无 关 代码 。 


获取 GOT 地 址 


首先 ， 为 了 生成 地 址 无 关 代码 ， 必 须 获取 GOT 地 址 。cbc 采用 和 gee 同样 的 方法 来 获取 
GOT 地 址 ， 因 此 先 来 看 如 何 生成 ”i686 .get pc thunk .bx 函数 。 

和 牛 成 ”_i686.get_pc thunk .bx 函数 的 代码 在 CodeGenerator 类 的 generateAssemblyCode 
方法 的 末尾 ， 这 部 分 代码 如 代码 清单 21.1 所 示 。 
代码 清单 21.1 generateAssemblyCode 方法 末尾 ( sysdep/x86/CodeGenerator.java ) 








if (ir.isCommonSymbolDefined()) { 
generateCommonSymbols(file, ir.definedCommonSymbols()); 


) 
if (options.isPositionIndependent()) ( 
PICThunk(file, GOTBaseReg()); 


) 


return file; 


已 经 许久 没 看 CodeGenerator 类 的 代码 了 , 让 我 们 先 确 认 一 下 方法 的 关系 。CodeGenerator 
KAJA O KAN generate 方法 ， 从 这 个 方法 里 调用 上 述 generateAssemblyCode 方法 。 
这 里 的 options.isPositionIndependent () 方法 在 cbc 指定 了 -fPIC 或 者 -fPIE 








选项 时 会 返回 true。 如 果 options.isPositionIndependent () 是 ttue， 那 么 就 有 必 
要 生成 地 址 无 关 代码 。 这 时 会 调用 PICThunk 方法 ， 在 汇编 文件 未 尾 生 成 ”i686.get pc 
thunk .bx MEX. PICThunk 方法 的 参数 中 的 GOTBaseReg () 和 bx() 是 一 样 的 ， 也 就 是 说 
它 也 是 表示 ebx 寄存 器 的 汇编 对 象 。 























PICThunk 函数 的 实现 


接 下 来 讲解 生成 获取 指令 地 址 代码 的 PICThunk 方法 。PICThunk 方法 的 代码 如 代码 清单 
21.2 所 示 。 
代码 清单 21.2. PICThunk 方法 ( sysdep/x86/CodeGenerator.java ) 





private void PICThunk (AssemblyCode file, Register reg) { 
Symbol sym = PICThunkSymbol (reg); 
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file. section(".text" + "." + sym.toSource(), 
"\"" + PICThunkSectionFlags + "VW"", 
SectionType bits, // This section contains data 
sym.toSource(), // The name of section group 
Linkage linkonce); // Only 1 copy should be generated 


file. globl(sym); 
file. hidden(sym); 
file. type(sym, SymbolType function); 
file.label(sym); 
file.mov(mem(sp()), reg); // fetch saved EIP to the GOT base register 
file.ret(); 


) 





首先 使 用 PICThunkSymbol ZriE 3X BURAIUNE- XI BJ Symbol 对 象 。PICThunkSymbol 
方法 的 代码 如 下 所 示 ， 要 点 是 生成 ” ie86.get pc _thunk.bx 这 样 的 符号 。 
代码 清单 21.3 PICThunkSymbol 方法 ( sysdep/x86/CodeGenerator.java ) 


private Symbol PICThunkSymbol (Register reg) { 
return new NamedSymbol("  i686.get pc thunk." + reg.baseName()); 


} 
接着 调用 的 _section 方法 和 hidden 方法 先 不 管 ， 来 看 看 生成 的 汇编 代码 ， 如 下 所 示 。 


.globl . i686.get pc thunk.bx 





.type . i686.get pc thunk.bx, Gfunction 
. i686.get pc thunk.bx: 

movil (zesp), %ebx 

HoE 








也 就 是 说 ， 就 像 上 一 节 讲 解 的 那样 ， 只 是 简单 地 封装 了 获取 指令 地 址 (eip AARRE ) 的 


FJ 删除 重复 函数 并 设置 不 可 见 属性 


问题 在 于 _section 方法 和 _hidaen 方法 的 部 分 。 

首先 ，_section 方法 用 于 生成 .section 伪 操 作 。 也 就 是 说 ， idi ds ELF 节 。 
PICThunk 方法 生成 的 .section 伪 操作 如 下 所 示 。 因 为 纸张 尺寸 限制 这 了 换行 ， 下 列 
代码 事实 上 是 一 行 。 

















.Section .text.  i686.get pc thunk.bx, "axG", VN 
Gprogbits, ^ i686.get pc thunk.bx, comdat 


这 个 .section 伪 操 作 的 参数 的 含义 如 表 21.1 所 示 。 
看 上 去 设置 的 项 很 多 很 复杂 ,但 目的 很 简单 。 即 使 多 次 生成 了 相同 的 __i686.get pc - 
thunk .px 国 数 ， 最 终 的 目标 文件 中 也 只 保留 一 段 代 码 。. section 伪 操作 的 目标 正 是 让 这 上段 
代码 在 全 文件 范围 内 共享 。 1i686.get_pc_ thunk.bx 困 数 在 每 一 个 附 上 -fPIC 选项 编译 
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的 文件 中 都 会 生成 ， 所 以 链接 后 的 目标 文件 中 也 会 重复 出 现 同样 内 容 的 函数 。 这 些 代 码 都 是 多 
余 的 ， 因 此 利用 ELF 的 功能 只 保留 一 份 副本 。 
表 21.1 .section 伪 操 作 的 参数 






























































参数 含义 
"axG" a: 映射 到 内 存 
x: 可 执行 
G : 该 节 归 属 到 节 组 
@progbits 在 ELF 文件 中 有 大 小 信息 
__i686.get_pc_thunk.bx | 节 组 名 称 
comdat 如 果 相 同 节 重复 出 现 ， 则 只 输出 最 后 一 个 到 目标 文件 中 
































其 次 ，_ hidaqen 方法 用 于 生成 .nidden WHE, .hidden 伪 操作 把 符号 的 可 见 性 设置 为 
HIDDEN， 使 其 他 目标 文件 无 法 读 取 这 个 符号 。 

339b, thunk 指 的 是 无 参数 的 辅助 函数 等 。thunk 的 含义 很 丰富 ， 有 时 还 会 用 作 其 他 含义 。 
璧 如 在 gec HP, thunk 指 的 恕 怕 就 是 不 由 用 户 产 生 的 、 也 不 是 库 的 函数 。 


加 载 GOT 地 址 


下 面 看 看 生成  i686.get pc thunk.bx 函数 调用 的 部 分 。 i686.get pc thunk. 
bx 函数 调用 是 在 generateFunctionBody 方法 中 生成 的 。 
代码 清单 21.4 generateFunctionBody 方法 ( sysdep/x86/CodeGenerator.java ) 














private void generateFunctionBody (AssemblyCode file, 
AssemblyCode body, StackFrameInfo frame) { 
file.virtualStack.reset(); 
prologue(file, frame.saveRegs, frame.frameSize()); 
if (options.isPositionIndependent() && body.doesUses (GOTBaseReg())) { 
loadGOTBaseAddress(file, GOTBaseReg()); 


) 


file.addAll(body.assemblies()); 

epilogue(file, frame.saveRegs); 

file.virtualStack.fixOffset(0); 
) 

这 里 请 注意 使 用 了 options.isPositioniIndependent () WIAR if iB/], options. 
isPositionIndependent () Jj true JfH body.doesUses (GOTBaseReg() ) 时 ， 也 就 是 
bx 寄存 器 正在 被 使 用 时 ， 调 用 1oadGoTBaseaAddqress 方法 ， 从 bx 寄存 器 中 取得 GOT 的 地 
址 。 在 cbe 生成 的 代码 中 ,“ 访 问 GOT” 也 就 是 “使 用 bx 寄存 器 ” ， 因 此 如 果 bx 寄存 器 正在 被 
使 用 ， 那么 这 段 代 码 的 作用 就 是 访问 GOT， 因 此 必须 把 GOT 地 址 存 人 bx 寄存 器 中 。 

loadGOTBaseAddress 方法 的 内 容 如 代码 清单 21.5 所 示 。 

首先 使 用 call 方法 生成 调用 。 i686.get_pc_thunk .bx 的 指令 ， 接着 使 用 add 方法 
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ÆW adal 指令 , 使 bx 寄存 器 的 值 加 上 $ GLOBAL OFFSET TABLE 。 上 一 节 中 已 经 介绍 过 
这 些 内 容 ， 并 没有 特别 复杂 的 地 方 。 
代码 清单 21.5 loadGOTBaseAddress 方法 ( sysdep/x86/CodeGenerator.java ) 


Static private final Symbol GOT = new NamedSymbol(" GLOBAL OFFSET TABLE "); 





private void loadGOTBaseAddress (AssemblyCode file, Register reg) { 
file.call(PICThunkSymbol (reg)); 
file.add(imm(GOT), reg); 





locateSymbols 函数 的 实现 


接 下 来 讲解 为 全 局 变量 分 配 内 存 引 用 的 locateSymbols 方法 。locateSymbols 
方法 在 CodeGenerator 类 的 人 口 函 数 generate 方 法 的 开头 被 调用 。 也 就 是 说 ,在 
CodeGenerator 类 的 处 理 开始 后 ， 马 上 就 会 调用 locateSymbols 方法 。 

locateSymbols 方法 的 代码 如 代码 清单 21.6 所 示 。 
代码 清单 21.6 locateSymbols 方法 ( sysdep/x86/CodeGenerator.java ) 














private void locateSymbols(IR ir) { 
SymbolTable constSymbols - new SymbolTable(CONST SYMBOL BASE); 
for (ConstantEntry ent : ir.constantTable().entries()) { 
locateStringLiteral(ent, constSymbols); 
) 
for (Variable var : ir.allGlobalVariables()) { 
locateGlobalVariable (var); 
) 
for (Function func : ir.allFunctions()) { 
locateFunction(func); 
) 
) 





分 别处 理 表 示 字 符 串 常量 的 ConstantEntry 对 象 、 表 示 全 局 变量 的 Variable 对 象 、 表 
PRA Function 对 象 等 ， 为 每 一 个 分 配 内 存 引用 。 下 面 让 我 们 稍稍 改变 一 下 顺序 ， 按 照 全 
变量 、 函 数 、 字 符 串 常量 的 顺序 来 详细 讲解 。 


FJ 全 局 变量 的 引用 


首先 讲解 为 全 局 变量 分 配 内 存 引 用 的 1ocateGlobalVariable 方 法 。 这 个 方法 的 代码 如 
代码 清单 21.7 所 示 。 
代码 清单 21.7 locateGlobalVariable 方法 ( sysdep/x86/CodeGenerator.java ) 








ap A 








private void locateGlobalVariable(Entity ent) { 
Symbol sym - symbol(ent.symbolString(), ent.isPrivate()); 
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if (options.isPositionIndependent()) ( 
if (ent.isPrivate() || optimizeGvarAccess(ent)) { 
ent.setMemref (mem(localGOTSymbol (sym), GOTBaseReg())); 


) 
else ( 
ent.setAddress (mem(globalGOTSymbol(sym), GOTBaseReg())); 


} 

} 

else { 
ent.setMemref (mem (sym) ) ; 
ent.setAddress (imm(sym)); 


) 


首先 调用 symbol 方法 ， 生 成 变量 符号 对 应 的 Symbol 对 象 。 根 据 symbol 方法 的 第 2 参 
数 ent.isPrivate() 的 值 决 定 生成 全 局 符号 还 是 局 部 符号 。 不 过 在 x86 CPU 架构 下 的 Linux 
上 ,无 论 变量 是 全 局 的 还 是 局 部 的 ， 都 使 用 同样 的 符号 ， 因 此 最 后 的 结果 实际 上 是 一 样 的 ， 都 
返回 new NamedSymbol (sym)。 

接着 根据 options .isPositionIndependent () 判断 是 否 生 成 地 址 无 关 代码 。 如 果 需 
要 生成 地 址 无 关 代 码 ， 则 生成 介入 了 GOT 的 内 存 引 用 ， 除 此 之 外 的 情况 下 生成 直接 指向 变量 符 
号 的 内 存 引 用 。 

下 面 讲 解 一 下 与 地 址 无 关 代 码 相关 的 部 分 。 

使 用 Variable 类 的 setMemref 方法 可 以 设置 获取 变量 值 的 内 存 引 用 。 如 果 是 地 址 
无 关 代 人 码 ， 那 么 变量 的 值 可 以 由 (gvar) 这 个 直接 内 存 引 用 得 到 ， 而 mem (sym) 可 以 由 
setMemref 方法 设置 。 

Ah, setAddress 方法 用 于 设置 获取 变量 地 址 的 内 存 引 用 或 者 立即 数 。 全 局 变量 的 地 址 
可 以 由 使 用 符号 的 Sgvar 这 个 立即 数 得 到 ， 因 此 使 用 setAddress 方法 设置 imm (sym) 。 


访问 全 局 变量 : 地 址 无 关 代码 的 情况 下 


接 下 来 讲解 地 址 无 关 代码 的 情况 下 访问 全 局 变量 的 方法 。 

在 地 址 无 关 代码 中 ， 变 量 作用 域 是 全 局 或 者 文件 局 部 时 访问 方法 不 一 样 。 如 果 是 全 局 作 
用 域 ， 则 必须 使 用 带 有 @GoT 的 符号 进行 访问 ; 如 果 是 文件 局 部 作用 域 ， 则 必须 使 用 带 有 e 
GOTOFF 的 符号 进行 访问 。 不 过 有 一 种 情况 例外 ， 那 就 是 在 生成 PIE 的 情况 下 ， 即 便 是 全 局 作 
用 域 ， 也 使 用 带 有 ecororr 的 符号 进行 访问 。 

另外 要 注意 一 点 ， 使 用 带 有 ecoTorr 的 符号 时 ， 可 以 访问 到 变量 本 身 ， 而 使 用 带 有 @Gom 
的 符号 时 ， 则 只 能 得 到 变量 的 地 址 。 

于 是 ， 当 变量 作用 域 为 文件 局 部 时 ， 或 者 在 生成 PIE 的 情况 下 变量 在 同一 个 文件 中 定义 时 
(optimizeGvarAccess (ent) )， 可 以 执行 下 列 代码 设置 内 存 引 用 。 
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ent.setMemref (mem(localGOTSymbol (sym), GOTBaseReg())); 





localGOTSymbol 是 为 符号 添加 @GOTOFF 的 方法 。 也 就 是 说 ， 这 里 的 mem 方法 生成 了 类 
fll gvarecoTorr (ebx) 这 样 的 间接 内 存 引用 。 因 为 是 内 存 引用 ， 所 以 和 mov 指令 一 起 使 用 
的 话 就 可 以 得 到 变量 值 ， 和 lea 指令 一 起 使 用 的 话 就 可 以 得 到 变量 地 址 。 

而 除 此 之 外 的 情况 下 则 执行 下 列 语句 ， 设 置 获 取 变 量 地 址 的 内 存 引用 。 

















ent.setAddress (mem(globalGOTSymbol (sym), GOTBaseReg())); 


globalGOTSymbol 是 为 符号 添加 eGoT 的 方法 。 也 就 是 说 ， 这 里 的 mem 方法 生成 了 类 似 
gvar@GOT (&ebx) 这 样 的 间接 内 存 引用 。 将 该 内 存 引用 和 mov 指令 一 起 使 用 就 可 以 得 到 变量 
地 址 。 想 要 获取 变量 值 的 话 ， 要 再 执行 一 次 mov 指令 。 


Fy 函数 的 符号 
接 下 来 讲解 为 函数 分 配 符号 和 内 存 引用 的 方法 。1ocatePunction 方法 用 于 为 函数 分 配 符 


号 和 内 存 引 用 ， 其 代码 如 代码 清单 21.8 所 示 。 
代码 清单 21.8 locateFunction 方法 ( sysdep/x86/CodeGenerator.java ) 




















private void locateFunction(Function func) { 
func.setCallingSymbol (callingSymbol (func)); 
locateGlobalVariable(func); 


) 
locateGlobalVariable 方法 也 可 以 获取 函数 指针 ， 因 此 设置 了 和 之 前 几乎 一 致 的 内 存 
引用 。 
另外 ， 因 为 调用 地 址 无 关 代 码 的 函数 时 一 定 要 经 由 PLT， 所 以 需要 通过 setcallingSymbol 
方法 设置 符号 。 下 面 看 看 作为 setcallingSymbol 方法 的 参数 的 callingsymbol 方法 的 代 
码 (代码 清单 21.9 )。 
代码 清单 21.9 callingSymbol 方法 ( sysdep/x86/CodeGenerator.java ) 




















private Symbol callingSymbol(Function func) { 
if (func.isPrivate()) { 
return privateSymbol(func.symbolString()); 


) 


else ( 
Symbol sym = globalSymbol(func.symbolString()); 
return shouldUsePLT(func) ? PLTSymbol(sym) : sym; 


) 


如 果 是 静态 函数 ( func .isPrivate() )， 汇 编 需 会 生成 使 用 相对 地 址 的 call 指令 ， 
只 要 生成 call func 这 样 的 指令 ， 代 码 就 自动 变 为 地 址 无 关 代码 了 。 这 种 情况 下 无 需 更 改 























424 | 第 21 章 生成 地 址 无 关 代码 


符号 。 可 以 利用 privatesymbol (func.symbolString ()) 生成 和 函数 名 一 样 的 符号 。 
另外 ， 如 果 函 数 作用 域 为 全 局 ， 那 么 地 址 无 关 代 码 和 其 他 情况 下 的 符号 会 不 一 致 。 在 代码 
清单 21.9 F, WR shouldUsePLT 方 法 返回 true， 则 生成 PLTSymbol (sym); 如 果 返 回 
false， 则 生成 sym。PLTSymbol 方法 会 为 符号 加 上 @PLT。 
下 面 来 看 一 下 判断 是 否 应 该 加 上 @PLT 的 shouldUsePLT 方法 的 实现 。 
代码 清单 21.10 shouldUsePLT 方法 ( sysdep/x86/CodeGenerator.java ) 





private boolean shouldUsePLT(Entity ent) { 
return options.isPositionIndependent() && !optimizeGvarAccess (ent); 


) 


ftoptions.isPositionIndependent() 为 true， 即 生成 地 址 无 关 代 人 码 ， 并 且 
optimizeGvarAccess (ent) 不 成 立 ， 即 “生成 PIE， 并 且 函 数 在 同一 个 文件 内 定义 ”以 外 
的 情况 下 ，shouldUsePLT 方法 都 返回 true。 

虽然 地 址 无 关 代码 的 规范 ( 尤其 是 PIE 的 异常 条 件 ) 相当 复杂 ， 很 难 理解 ， 但 也 就 是 上 述 
逻辑 而 已 。 


F3 字符 串 常量 的 引用 


最 后 让 我 们 来 看 看 设置 访问 字符 串 常 量 的 内 存 引 用 的 locatestringLiteral 方法 , 其 
代码 如 代码 清单 21.11 所 示 。 
代码 清单 21.11 locateStringLiteral 方法 ( sysdep/x86/CodeGenerator.java ) 




















private void locateStringLiteral(ConstantEntry ent, SymbolTable syms) { 
ent.setSymbol(syms.newSymbol()); 
if (options.isPositionIndependent()) ( 
Symbol offset = localGOTSymbol (ent.symbol()); 
ent.setMemref (mem(offset, GOTBaseReg())); 


} 

else { 
ent.setMemref (mem(ent.symbol())); 
ent .setAddress (imm (ent . symbol ())); 


) 


访问 字符 串 和 常量 和 访问 文件 局 部 的 全 局 变量 几乎 一 致 。 不 过 考虑 到 优化 处 理 ， 最 好 把 
setAddress 方法 可 接受 的 值 限定 为 立即 数 ， 因 此 生成 地 址 无 关 代 码 时 只 会 设置 内 存 引用 。 

另外 ,方法 的 第 1 行 调用 的 setSymbol 方法 为 字符 串 篆 量 分 配 了 . Lco 这 样 的 连 号 的 符 
5, SymbolTable X% symbols 会 管理 这 些 符 号 ， 并 在 newSymbol 方法 被 调用 时 生成 新 的 
号 码 的 符号 。 

到 这 里 CodeGenerator 类 的 主要 函数 就 全 部 讲解 完毕 了 ， 接 下 来 就 只 剩 调 用 18 命令 进 
行 链接 了 。 
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链接 器 调用 的 实现 








本 节 我 们 来 为 cbe 实现 生成 可 执行 文件 和 共享 文件 的 功能 。 
[J 生成 可 执行 文件 
首先 来 看 生成 可 执行 文件 的 代码 。 生 成 可 执行 文件 的 时 候 ， 只 需 如 下 执行 1a 命令 即 可 。 


















































d 
Vas eset (e) usr Mato ert cto) NN 
旨 定 用 户 的 链接 器 选项 N 
标 文件 1 目标 文件 2…… N 
-Jelex Je X 


usr yal en on 
-o 输出 文件 名 


启动 链接 器 生成 可 执行 文件 的 generateExecutable 方法 如 代码 清单 21.12 所 示 。 
代码 清单 21.12 generateExecutable 方法 ( sysdep/GNULinker.java ) 


























Static final private String LINKER = "/usr/bin/ldà"; 

static final private String DYNAMIC LINKER = "/llib/ld-linux.so.2"; 
Static final private String C RUNTIME INIT = "/lusr/lib/crti.o"; 
Static final private String C RUNTIME STAR = "/lusr/lib/crtl.o"; 
Static final private String C RUNTIME START PIE = "/usr/lib/Scrt1.0o"; 
Static final private String C RUNTIME FINI - "/usr/lib/crtn.o"; 


public void generateExecutable(List«String» args, 
String destPath, LinkerOptions opts) throws IPCException { 
List«String» cmd = new ArrayList«String»(); 
cmd.add (LINKER); 
cmd.add("-dynamic-linker"); 
cmd .add (DYNAMIC LINKER); 
if (opts.generatingPIE) ( 
cmd.add("-pie"); 
) 
if (! opts.noStartFiles) { 
cmd.add(opts.generatingPIE 
? C RUNTIME START PIE 
: C RUNTIME START); 
cmd.add(C RUNTIME INIT); 

















) 


cmd.addAl11 (args); 
if (! opts.noDefaultLibs) { 
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cmd.add("-1c"); 
cmd.add("-1cbc"); 


) 


if (! opts.noStartFiles) ( 
cmd.add(C RUNTIME FINI); 


) 


cmd.add("-o"); 
cmd.add(destPath); 
CommandUtils.invoke(cmd, errorHandler, opts.verbose); 


} 
首先 生成 新 的 ArrayList 对 象 赋值 给 局 部 变量 cmd， 并 调用 aaa 方法 添加 命令 行 参 数 。 
最 后 调用 CommandUtils 类 的 invoke 方法 执行 命令 。 

用 户 指定 给 cbe 的 命令 行 参数 ， 壁 如 目标 文件 、 库 、 库 的 检索 路 径 -L 等 都 加 入 了 opts. 
ldArgs () 返回 的 列表 中 。 调 用 aadAl1 把 这 个 列表 添加 到 cmd， 就 可 以 把 参数 按照 和 用 户 指 
定 的 顺序 同样 的 顺序 传递 给 18 命令 。 

另外 ， 中 间 的 opts.noStartFiles # opts.noDefaultLibs 等 的 值 都 会 随 着 cbe 
的 选项 而 改变 。 表 21.2 中 列举 了 cbe 选项 及 其 含义 ， 以 及 对 应 的 Options 对 象 的 属性 。 




















R 21.2 cbe 的 链接 器 选项 和 Options 类 的 属性 的 对 应 





























选项 对 应 的 属性 含义 
-pie isGeneratePIE 生成 PIE 
-nostartfiles noStartFiles 不 链接 crt 文件 
-nodefaultlibs noDefaultLibs 不 链接 libe 和 libcbc 
这 些 选项 和 gee 的 选项 相似 。 除 了 libeec 相关 功能 外 ， 我 们 尽 可 能 地 把 cbe 实现 得 和 gec 行 


为 一 致 。 


F generateSharedLibrary 方法 
最 后 来 看 看 生成 共享 库 的 代码 。 生 成 共享 库 时 ， 只 需 如 下 执行 1a 命令 即 可 。 











ld -shared \ 

sr iere ikon 

指定 用 户 的 链接 器 选项 \ 
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启动 链接 需 生 成 共享 库 的 generateSharedLibrary 方法 如 代码 清单 21.13 所 示 。 
代码 清单 21.13 generateSharedLibrary 方法 ( sysdep/GNULinker.java ) 


public void generateSharedLibrary(List«String» args, 
String destPath, LinkerOptions opts) throws IPCException { 


List«String» cmd 

cmd.add (LINKER); 

cmd.add("-shared"); 

if (! opts.noStartFiles) { 
cmd.add(C RUNTIME INIT); 


new ArrayList«String»(); 


) 


cmd.addAl11 (args); 


if (! opts.noDefaultLibs) { 
emd.add("-1c"); 
cmd.add("-lcbc"); 

) 

if (! opts.noStartFiles) { 


cmd.add(C RUNTIME FINI); 
} 
cmd.add("-o"); 
cmd.add (destPath); 


CommandUtils.invoke(cmd, errorHandler, 


) 
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opts.verbose); 


这 个 方法 除了 ema 的 内 容 有 所 不 同 以 外 ， 其 他 都 和 generateExecutable 一 致 ， 也 不 难 











解 一 下 指定 soname 的 方法 。cbc E WEE JA 








E 时 ， 要 指定 soname， 需 要 如 下 使 


$ cbc -shared -Wl,-soname,libmy.so.1 obji.o obj2.0o -o libmy.so.1 


Ý generateSharedLibrary JE, -w1 指定 的 参数 包含 在 的 opts.1daArgs () HP, 


并 被 直接 传递 给 1d 命令 。 
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D 
TEM. serenan 








本 节 让 我 们 一 起 回顾 一 下 本 书 的 内 容 ， 纵 观 从 解析 源 代 码 到 生成 代码 、 汇 编 、 链 接 、 加 载 
等 的 过 程 。 


build 和 加 载 的 过 程 


至 此 cbe 已 经 完成 。 最 后 让 我 们 利用 目前 为 止 实现 的 所 有 功能 ,来 见证 一 下 程序 被 build、 
加 载 的 全 过 程 。 

首先 来 build 如 代码 清单 21.14 所 示 的 Cb 程序 。 
代码 清单 21.14 main.cb 











import stdio; 
import dilfcn; 
import lib; 


typedef int (char*, ...)* printf t; 


int 

main(int argc, char** argv) 
void* h; 
printf t p; 


int x = 5; 

int* ptr - &x; 

int y = f(++*ptr) * 7; 
printf ("y #1 = $àNn", y--); 


h - dlopen("/lib/libc.so.6", RTLD LAZY | RTLD GLOBAL); 
p dlsym(h, "printf"); 
p("y #2 = $a", y); 


return 0; 





这 个 例子 里 包含 了 数学 运算 、 有 副作用 的 语句 、 函 数 调用 、 字 符 串 常量 、 利 用 typedef xE 
义 类 型 的 语句 、 本 地 库 函 数 调用 、 动 态 加 载 等 内 容 。 
其 中 ， 中 途 使 用 的 函数 定义 在 如 代码 清单 21.15 所 示 的 Lib. cb 文件 中 。 
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代码 清单 21.15  lib.cb 
int gvar = 9; 
int 
f(int x) 


Í 
} 


return gvar * x; 


这 个 文件 还 包含 全 局 变量 的 定义 和 引用 。 
我 们 将 这 个 lib.cb 文件 编译 成 共享 库 ， 并 和 main .cb 的 目标 文件 链接 。 另 外 ， 共 享 库 
的 代码 要 设置 成 地 址 无 关 的 ， 并 生成 PIE 可 执行 文件 。 


词法 分 析 


译 的 首要 步骤 是 源 代 码 的 词法 分 析 。 所 谓词 法 分 析 ， 是 指 把 源 代 码 的 文本 分 割 成 token 
的 处 理 。 为 cbc 加 上 - -aump-tokens 选项 即 可 输出 词法 分 析 的 结果 。 











E 

















$ cbc --dump-tokens main.cb 


"import" "import" 
«SPACES» LR 
«IDENTIFIER- "stdio" 
n" R " n" R n" 
«SPACES» Nm 
"import" "import" 
«SPACES» mon 
«IDENTIFIER- Miller 
" 8 " " * " 
«SPACES» TNI 

Um scd Wm sd 
«SPACES» D 
«IDENTIFIER» Tabs 

n" A " n" 5 " 
«SPACES» IEN TAN ra 
Doy ecc Boy ecc 
«SPACES» Tet 
"int" "int" 
«SPACES» D 

n" ( " n" ( n" 
massu emassu 


( 以 下 省 略 ) 





这 样 一 来 ， 源 代码 就 会 被 分 割 成 单词 ， 并 分 别 设 定 了 单词 种 类 和 语义 值 。 





语法 分 析 























编译 的 第 2 步 是 语法 分 析 。 语 法 分 析 的 过 程 就 是 分 析 token 序列 ， 得 到 树 形 结构 。 语 法 分 
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析 得 到 的 树 结构 就 是 抽象 语法 树 。 使 用 cbc 命令 的 - -daump-ast 选项 就 可 以 输出 抽象 语法 树 。 


$ cbc --dump-ast main.cb 
««AST»» (main.cb:1) 


variables: 
functions: 
««DefinedFunction»» (main.cb:7) 
name: "main" 
isPrivate: false 
params: 
parameters: 
««Parameter»» (main.cb:8) 
name: "argc" 
typeNode: int 
««Parameter»» (main.cb:8) 
name: "argv" 
typeNode: char** 
body: 
««BlockNode»» (main.cb:9) 
variables: 
««DefinedVariable»» (main.cb:10) 
name: "h" 
isPrivate: false 
typeNode: void* 
initializer: null 
««DefinedVariable»» (main.cb:11) 
pamek "neu 
isPrivate: false 
typeNode: printf t 
initializer: null 


( 以 下 省 略 ) 


像 这样 ， 单 纯 的 文本 被 转变 为 树 形 结构 ， 易 于 编译 需 处 理 。 


生成 中 间 代 码 


编译 的 第 3 步 是 语义 分 析 和 生成 中 间 代 但。 语义 分 析 是 指 把 变量 引用 和 实体 链接 起 来 ， 并 
进行 类 型 检查 。 软 认 的 构造 等 和 类 型 检查 同时 进行 。 

语义 分 析 结 束 后 ， 接 着 把 抽象 语法 树 转 换 成 易于 优化 、 易 于 生成 代码 的 中 间 代 码 。 为 cbc 
加 上 --dump-ir 选项 就 可 以 输出 中 间 代 码 的 树 。 





























$ cbc --dump-ir main.cb 
««IR»» (main.cb:1) 
variables: 
functions: 
««DefinedFunction»» (main.cb:7) 
name: main 
isPrivate: false 
type: int(int, char**) 
body: 
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««Assign»» (main.cb:13) 
lhs: 

««Addr»» 

type: INT32 

entity: x 
rhs: 

««Int»» 

type: INT32 

valtis: 5 
<<Assign>> (main.cb:14) 
MASE 

<<Addr>> 

CYPE ENTnS 

entity: ptr 
rhs: 

<<Addr>> 

type: INT32 

entity: x 
<<Assign>> (main.cb:15) 
TASE 

<<Addr>> 

[EV MENS 

entity: @tmp0 

( 以 下 省 略 ) 


变 为 中 间 代 码 后 ， 构 成 语法 树 的 节点 种 类 大 幅度 减少 ， 类 型 也 只 剩 下 汇编 语言 可 以 直接 处 
理 的 简单 类 型 ， 并 且 副 作用 也 缩减 到 一 个 stmt 节点 只 有 一 个 的 程度 。 通 过 这 个 步骤 ,下面 的 
处 理会 简洁 很 多 。 


[y 生成 代码 
编译 的 最 后 过 程 就 是 生成 代码 。 把 中 间 代 码 树 的 节点 逐个 ， 或 者 通过 模式 匹配 多 个 一 起 转 
换 成 汇编 语言 的 指令 。 为 cbc 命令 加 上 - -print -asm 选项 就 可 以 输出 生成 的 汇编 代码 。 


Hn ğ 




































































$ cbc -O -fPIE --print-asm main.cb 


.file "main.cb" 

Section .rodata 
ECO: 

.String "y 41 - $din" 
-ECI 

a /li eS oe 
“EBC: 

Seilere DhsyesbwueyE 
-ECS 

Toering Uy? eb es ON 

Ee 
.globl main 

.type main, @function 
main: 


pushl Sebp 
movi S$esp, $ebp 
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movl $ebx, -4(%ebp) 
subl $48, %esp 
call . i686.get pc thunk.bx 
addl $ GLOBAL OFFSET TABLE , $ebx 
movl $5, %eax 
movil $eax, -16($ebp) 
leal -16 (%ebp), $eax 
movl $eax, -20 (%ebp) 
movl -20 (%ebp), %eax 
movil $eax, -28 (%ebp) 
movl -28(S$ebp), %eax 
movil (Seax), Seax 
amc $eax 

















CPU 上 的 寄存 器 只 有 几 个， 因此 把 大 量 的 变量 限制 在 寄存 器 中 处 理 这 一 点 非常 重要 。 这 需 
要 遵守 程序 调用 约定 构建 栈 帧 ， 并 和 其 他 库 进 行 协调 。 还 要 注意 在 生成 共享 库 以 及 PIE 时 生成 
地 址 无 关 代 码 。 


F3 ;汇编 
至 此 编译 过 程 已 经 结束 ， 之 后 需要 执行 binutils 包 里 的 命令 进行 处 理 
首先 需要 调用 as 命令 把 汇编 语言 的 代码 进行 汇编 























o 





























o 


$ cbc -S -O -fPIE main.cb 
$ cbc -c -v main.cb 
as -o main.o main.s 


这 时 文件 内 的 变量 访问 基本 上 都 转变 为 通过 相对 地 址 访问 ， 代 码 中 的 变量 名 已 经 消除 。 这 
时 如 果 无 法 决定 最 终 地 址 ， 可 以 生成 重 定位 信息 ， 在 下 一 步 链接 时 再 解决 。 

汇编 的 输出 就 是 ELF 的 可 重 定位 文件 main .o。 可 重 定位 文件 中 还 欠缺 程序 头等 信息 ， 重 
定位 尚未 完成 ， 因 此 还 不 能 直接 运行 。 


在 最 终 进行 链接 之 前 ， 要 编译 、 汇 编 1ib . cb， 生 成 共享 库 。 为 使 得 共享 库 在 内 存 上 共享 ， 
关键 就 在 于 把 库 代 码 全 部 设置 为 地 址 无 关 代码 。 

要 生成 地 址 无 关 代 码 ， 可 以 像 下 面 这 样 在 cbe 命令 后 附 上 -fPIC 选项 进行 编译 。 附 
上 -fPIC 选项 生成 代码 后 ， 访 问 全 局 变量 、 函 数 时 都 经 由 GOT 进行 ， 不 必 再 进行 重 定位 。 











































































































$ cbc -c -0 -fPIC lib.cb 
接 下 来 由 cbe 命令 调用 ld 命令 ， 生 成 共享 库 。 此 外 ， 为 方便 进行 版 本 管理 ， 也 加 上 soname. 


$ cbc -v -shared -Wl,-soname,libmy.so.1 lib.o -o libmy.so.1 
/usr/bin/ld -shared /usr/lib/crti.o -L/usr/local/cbc/lib -soname libmy.so.1 lib.o 
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-lc -lcbc /usr/lib/crtn.o -o libmy.so.1 
$ ln -s libmy.so.1 libmy.so 








自动 链接 的 crt* 文件 就 是 C 运行 时 环境 。C 运行 时 是 libe 提供 的 目标 文件 ， 其 中 包含 程 
序 的 初始 化 、 终 止 处 理 等 的 代码 ， 还 包含 作为 程序 入 口 的 _start KASE, 


生成 可 执行 文件 


最 后 ， 再 次 通过 coe 命令 启动 19， 生 成 可 执行 文件 。 为 链接 f 函数 ， 需 要 附 上 -1my 选项 链 
接 libmy.so.1。 男 外 ， 为 链接 dlopen PRX, alsym 函数 等 ， 要 附 上 -191 选项 链接 libdl.so.2. 








$ cbc -v -pie main.o -L. -lmy -o main 
/usr/bin/ld -dynamic-linker /lib/ld-linux.so.2 -pie /usr/lib/Scrtl.o /usr/lib/crti.o 
-L/home/aamine/c/stdcompiler/src/lib main.o -L. -lmy -lc -lcbc /usr/lib/crtn.o -o main 


这 里 加 上 了 生成 PIE 的 -pie 选项 。 要 生成 PIE， 需 要 把 C 运行 时 的 代码 也 替换 成 地 址 无 
关 代 码 ， 因 此 链接 的 文件 从 crt1.o 变 为 Scrt1.o。 

生成 的 可 执行 文件 main 完成 了 所 有 的 重 定位 操作 ， 生 成 了 程序 头 信息 ， 并 且 可 以 被 加 载 。 
另外 还 可 以 根据 DYNAMIC 段 的 信息 决定 是 否 可 以 动态 链接 。 


F3 nik 
至 此 程序 的 build 工作 已 经 全 部 完成 。 现 在 1ibmy . so.1 在 当前 文件 夹 ， 因 此 可 以 通过 设 
置 LD LIBRARY PATH 环境 变量 指定 运行 时 库 的 搜索 路 径 ， 启 动 main 程序 。 




















$ LD LIBRARY PATH-. ./main 
xe sd m S 
y 2 SIN, 


顺利 执行 了 程序 。 不 过 ， 如 果 是 动态 链接 的 程序 ,那么 main 函数 执行 之 前 的 过 程 也 是 非 
常 复杂 的 。 

首先 ， 系 统 内 核 把 main 和 1d.so 映射 到 内 存 上 ， 转 入 Id.so 的 处 理 。1d.so 在 完成 初始 化 后 ， 
加 载 所 有 必需 的 共享 库 ， 之 后 进行 符号 消解 和 重 定位 。 这 时 libc.so.6、libdl.so.2 和 
libmy .so.1 被 加 载 。 男 外 ， 因 为 生成 了 PIE， 所 以 en id pe 

最 后 执行 程序 和 库 的 .init 节 等 中 的 初始 化 代码 ， 经 过 start PRABUHZA- T 4415 main PRAEC, 

LAX main 因数 中 包含 alopen KIHE, 所 以 main 国 数 执行 后 再 次 转 入 ld.so 的 操 
作 ， 进 行 链接 。 

从 main 子 数 返回 后 ， 进 行 终止 处 理 并 执行 exit 系统 调用 ， 终 止 进程 。 

以 上 就 是 程序 从 build 到 执行 完毕 的 整个 过 程 。 虽然 整 个 过 程 相当 漫长 ， 但 也 在 不 知 不 觉 间 
讲解 完毕 了 。 谢 谢 大 家 。 



































扩展 阅读 





这 是 本 书 的 最 后 一 章 。 本 章 将 涉及 一 些 之 前 没有 
提 及 的 话题 ， 并 为 大 家 推荐 一 些 参考 书 ， 帮 助 大 
家 加 深 对 本 书 内 容 的 理解 。 
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[Pj 编译 器 相关 
以 下 是 全 面 讲解 编译 器 的 优秀 著作 。 





Alfred V. Aho, Monica S. Lam, Ravi Sethi, Jeffrey D. Ullman 著 ， 起 建华 、 郑 滔 译 ,《 编 
译 原 理 ( 第 2 版 )》 机 械 工业 出 版 社 ，2009 

本 书 就 是 被 誉 为 “ 龙 书 ”的 名 著 。 虽 说 在 过 去 很 长 一 段 时 间 内 ， 人 们 在 想 了 解 编译 器 时 都 首选 
“ 龙 书 ”"， 但 初版 在 1977 年 发 行 的 本 书 从 内 容 上 来 说 还 是 相对 陈旧 了 。 

不 过 第 2 版 对 初版 进行 了 全 面 的 修订 ， 并 新 增 了 两 章节 内 容 ， 所 以 本 书 依然 有 很 高 的 参考 价值 。 
中 田 育 男 ,「 274420148 Cis, 」( 编译 器 的 结构 和 最 优化 ), SHEER, 1999 
本 编译 器 研究 泰斗 的 著作 。 这 本 书 也 提 到 了 语法 分 析 、 语 义 分 析 ， 但 主要 还 是 讲 优化 方面 的 
内 容 。 这 本 书 非常 详细 地 讲述 了 有 效 进 行 寄存 器 分 配 的 方法 、 循 环 优化 等 ， 在 实际 的 编译 器 优化 工作 
中 可 以 说 是 一 个 有 力 的 助手 。 
Andrew W.Appel, Modern Compiler Implementation in ML, Cambridge University Press, 
1997 

文 如 其 题 ， 本 书 讲述 的 是 “现代 ”编译 器 的 实现 ， 包 括 利用 树 形 结构 的 中 间 代 码 和 模式 匹配 进 
行 指令 选择 、 函 数 式 语 言 和 面向 对 象 语言 的 实现 、 利 用 SSA 进行 数据 流 分 析 等 诸多 话题 。 

另外 还 有 Java 和 C 版 本 的 姐妹 篇 ， 不 过 笔者 个 人 觉得 ML 版 本 的 读 起 来 最 易 懂 ( 不 过 只 有 英文 
版 本 ) "S 


[3 语法 分 析 相关 
下 面 推荐 几 本 与 语法 分 析 相 关 的 图 书 。 


五 月 女 健 治 , 『 JavaCC l, 77277VvA, 2003 
这 了 恐怕 是 有 关 JavaCC 的 唯一 的 日 文书 了 ( 网 上 很 难 查 到 JavaCC 相关 的 资料 ， 幸 好 还 有 这 本 

































































































































































































































































































































































































































































D C 版 本 有 中 译本 ， 书 名 为 《现代 编译 原理 :C 语言 描述 》 人民 邮电 出 版 社 2006 年 出 版 。 译 者 注 
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书 Jo 本 书 








涉及 























我 们 这 本 书 中 未 提 及 的 错误 处 理 等 内 容 ， 
Ur NEG, [274 T AC I CRWESRATI), 








本 书 是 关于 编译 器 总 体 的 入 门 书 
Jeffrey E. F. Fried 著 ， 余 晟 译 ,《 精 通 正则 表达 式 ( 第 3 版 

















， 其 中 yace 相关 的 知识 














这 是 一 本 讲解 正则 表达 式 的 宝 
“匹配 双 引 号 


















































中 的 字符 串 字 面 量 的 正 见 











表达 式 " 





p 


HIY Zit, 2008 


有 参考 价值 。 





























书 。 本 书 讲解 了 很 多 可 以 用 于 源 代码 分 析 的 正 


“匹配 C 语言 命令 区 





解 得 相当 详尽 。 








)》 电子 工业 出 版 社 ，2012 
则 表达 式 ， 壁 如 








正则 表达 式 ” 等 。 


青木 峰 郎 ,『 Ruby & 256 f&4i& J EDONA | ( Ruby 高 效 开 发 )， 也 又 圭一 出 版 局 ，2001 











本 书 是 











笔者 的 第 一 本 著作 ， 讲 解 








了 如 何 使 用 Ruby 版 解释 器 生成 工具 Racc 进行 语 ; 
































分 析 。 Ruby 





























本 身 就 擅长 文本 处 理 ， 因 此 可 以 不 用 





A 
理会 








不 错 的 书 。 
目前 几乎 没有 单纯 1 














解 语法 分 析 的 书 。 上 面 介 





LALR 相关 的 内 容 ， 大 家 可 以 参考 一 下 。 


汇编 语言 相关 





很 多 琐碎 细节 ， 集 中 精力 进行 语法 分 析 ， 笔 者 觉得 这 是 一 

















本 





绍 的 编译 器 相关 的 图 书 里 一 般 都 有 IL、 








下 面 介绍 几 本 深入 学 习 汇编 语言 时 可 用 的 参考 书 。 
KRALE, [x86 7477 72AXFP81(x86;L28A 01] )，CQ 出 版 ，2006 











AERE T x86 CPU 必要 的 大 部 分 指令 ， 包 括 我 











指令 、SSE 指令 等 。 内 容 相当 全 面 ， 


























遗憾 的 是 本 书 中 没有 介绍 AMD64、 














以 作为 案头 参考 。 


可 


们 这 本 





书 中 未 提 及 的 指令 、 浮 点 数 指令 、MMX 














应 该 可 以 作为 Intel 和 





AMD 的 参考 手册 


了 。 





SSE3 相关 的 内 容 ， 不 过 本 书 和 我 们 这 本 书 合 在 一 起 的 话 ， 














薄 地 辉 沿 、 水 越 康 博 ,『 (US CERU Pentium | ( Pentium 初探 )， TRE MN 2004 


































































































































































































x86 汇编 器 的 入 门 书 。 本 书 一 开始 就 殷 出 了 “计算 机 只 能 处 理 机 器 码 ” 这 个 大 原则 ， 并 带领 读者 
使 用 调试 器 学 习 机 器 码 指令 。 内 容 详实 、 讲 解 清晰 ， 非 常 适合 初学 者 。 
SUR, [UDTR 486 」( 486 初探 )， 也 又 圭一 出 版 局 ，1994 

从 内 容 上 说 ， 本 书 可 以 作为 上 本 书 的 续 作 。 它 讲解 了 我 们 这 本 书 完全 没有 涉及 的 系统 CPU 的 功 
能 ， 对 虚拟 内 存 、 内 存 页 共享 等 话题 也 有 所 涉及 。 

就 现在 而 言 486 已 经 是 古老 的 CPU 了 ， 但 其 基本 构造 和 现代 CPU 别 无 二 致 。 通 过 这 本 书 ， 

















定 可 以 加 深 对 现代 操作 系统 的 理解 。 
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链接 、 加 载 相关 








关于 链接 和 加 载 ， 这 里 为 大 家 推荐 以 下 几 本 图 书 。 





John R. Levine, Linkers & Loaders, Morgan Kaufmann, 1999 

这 是 目前 关于 链接 、 加 载 最 全 面 最 可 靠 的 图 书 。 不 过 因为 书 中 过 多 地 讲解 了 运行 环境 相关 的 话 
题 ， 有 点 难 读 懂 ， 最 好 带 着 具体 的 问题 去 读 这 本 书 。 
高 林 哲 、 疙 饲 文敏 、 佐 芯 社 介 、 汽 地 慎 一 郎 、 首 蕨 一 幸 ，[ Binary Hacks」, 才 1 一 :学 
C*Y^Sz, 2006 

本 书 涵盖 了 链接 、 加 载 、 运 行 时 、 调 试 器 、 安 全 等 高 阶 话题 ， 还 涉及 了 C++ 程序 运行 时 环境 。 
通过 我 们 这 本 书 学 习 链 接 和 加 载 的 整体 结构 后 再 读 这 本 书 会 很 有 收获 。 
Peter van der Linden 著 ， 徐 波 译 ,《C 专家 编程 (第 2 版 )》” 人 民 邮 电 出 版 社 ，2008 
虽然 是 本 C 语言 相关 的 书 ， 但 因为 作者 是 Sun Microsystems 公司 链接 器 小 组 的 人 ， 因 此 链 
相关 的 内 容 非常 详实 。 虽 然 有 些 地 方 的 确 很 旧 了 ， 不 过 笔者 依然 很 喜欢 ， 所 以 推荐 给 大 家 。 
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各 种 编程 语言 的 功能 





Cb 以 C 语言 为 原型 ， 但 删 减 了 很 多 功能 。 现 在 很 多 编程 语言 都 比 Cb 具备 更 多 的 功能 ， 并 
提供 了 更 复杂 的 编译 需 结 构 和 执行 环境 。 
本 节 将 简单 讲述 现代 编程 语言 所 具备 的 各 种 各 样 的 功能 的 实现 和 信息 。 


异常 封装 相关 的 图 书 














异常 (exception ) 即便 在 Java 中 使 用 频率 也 很 高 ， 相 信 本 书 的 读者 应 该 对 其 功能 、 特 征 并 


不 陌生 。 不 过 讲解 异常 





封装 的 图 书 非常 少 ， 


所 以 这 里 只 列举 以 下 两 本 。 








高 林 哲 、 关 饲 文敏 、 佐 芯 衬 介 、 浜 地 慎 一 郎 、 首 芯 一 幸 ,『 Binary Hacks l, 4240U—* 7 


*T^Nz, 2006 














本 书 中 有 专门 的 章节 来 详细 讲解 gcc 中 C++ 异常 处 理 的 内 容 。 

















£Éobttw EOS, BRER, [ Ruby 一 又 刁 一 上 完全 解说 」( Ruby 源码 分 析 ), T 


> 了 了 L 又 ，2002 












































数 进行 异常 处 理 的 机 制 。 





阅读 实际 的 编程 语言 的 代码 最 有 助 于 学 习 蜡 稼 处 到 

















很 容易 获取 ， 大 家 可 以 找 喜 欢 的 编程 语言 


[ 阿 垃 圾 回收 



























































的 代码 来 阅读 。 




















通称 RHG， 是 笔者 的 代表 作 。 第 3 部 分 详细 地 讲解 了 面向 对 象 编程 语言 Ruby 中 使 用 setjmp A 


相关 的 内 容 。 最 近 Java VM 等 源 代码 都 











下 面 讲述 一 下 垃圾 回收 相关 的 内 容 。 








垃圾 回收 (Garbage Collection, GC ) 指 的 是 自动 回收 无 用 内 存 的 功能 。 月 











好 像 是 自动 对 malloc () 申请 的 内 存 进 行 Eree () 操作 一 样 。 
垃圾 回收 的 实现 方式 有 标记 & 清除 (mark & sweep ) 和 停止 & 复制 (stop & copy ) 这 两 


大 类 。 





日 C 语言 来 说 ， 就 


所 谓 标 记 & 清除 方法 ， 指 的 是 从 当前 正在 使 用 的 对 象 开始 ， 为 可 以 访问 到 的 所 有 对 象 递归 
地 打上 “存活 ”标记 ， 最 后 释放 没有 “存活 ”标记 的 所 有 对 象 的 内 存 空间 的 方法 。 
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而 停止 & 复制 方法 则 首先 把 内 存 空间 分 割 为 两 部 分 ， 一 部 分 是 “ 主 内 存 空间 ”， 男 一 部 分 
是 “次 内 存 空间 ”， 并 把 所 有 对 象 生成 在 主 内 存 空 间 中 。 然 后 在 发 生 垃圾 回收 的 时 候 ， 从 当前 正 
在 使 用 的 对 象 开 始 ， 查 找 所 有 能 访问 到 的 对 象 ， 把 这 些 对 象 全 部 复制 到 次 内 存 空 间 中 。 这 样 一 
来 ， 尚 可 被 访问 的 对 象 就 全 部 移动 到 了 次 内 存 空间 中 ， 访 问 不 到 的 对 象 则 遗留 在 了 主 内 存 空间 ， 
再 把 主 内 存 空间 直接 舍弃 。 之 后 切换 主 次 内 存 空 间 ， 继 续 执 行程 序 。 

另外 ， 还 有 一 些 技术 组 合 使 用 了 这 两 种 方法 ， 比 如 可 以 中 断 的 增 量 式 GC (incremental 
GC )、 对 长 时 间 不 释放 的 对 象 进 行 特别 处 理 从 而 减少 处 理 对 象 个 数 来 提高 GC 效率 的 分 代 GC 
( generational GC )、 把 垃圾 回收 处 理 分 散 到 多 个 进程 进行 的 分 布 式 GC ( distributed GC ) 等 。 


p 垃圾 回收 相关 的 图 书 
虽然 垃圾 回收 已 经 非常 普及 ， 但 详细 讲解 相关 技术 的 书 几乎 不 存在 。 

















Richard Jones, Rafael Lins, Garbage Collection, John Wiley & Sons, 1996 

专门 讲解 垃圾 回收 的 了 珍本。 这 本 书 已 经 有 些 年 份 了 ， 但 成 书 时 垃圾 回收 的 基础 技术 已 经 成 型 ， 
所 以 这 本 书 不 算 过 时 ( 不 过 只 有 英文 版 本 )。 
去 一 忻 过 由 六 从 力 监 修 ， 青 木 峰 郎 ,| Ruby V—AX2— F 完全 解说 」( Ruby 源码 分 析 ), f 
LZZvA, 2002 
详细 讲解 了 Ruby 的 标记 & 清除 GC 的 实现 。 






































































































































学 习 垃 圾 回收 技术 最 优质 的 资源 同样 是 源 代 码 。 各 种 Java VM 的 实现 都 可 供 参考 ， 实 现 C/ 
C++ 垃圾 回收 功能 的 Boehm-Demers-Weiser conservative garbage collector 等 也 是 现成 的 样 例 。 


面向 对 象 编程 语言 的 实现 


虽然 面向 对 象 编程 语言 ( object oriented programming language ) 已 经 非常 普及 了 ， 不 过 其 实 
现 方法 却 比 从 前 难 理解 了 。 

(基于 类 的 ) 面向 对 象 编 程 语言 的 基本 功能 有 使 用 类 (class) 的 实例 (instance ) 的 生成 、 
类 的 继承 (inheritance )、 方 法 调用 (method invocation )、 多 态 (polymorphism ) 的 实现 、 实 例 
变量 (instance variable ) 等 。 

C++ 的 vtbl ( virtual table, 虚 函 数 表 ) 可 以 算是 方法 、 继 承 以 及 多 态 的 经 典 实 现 。vtbl 是 
包含 了 实现 方法 的 函数 指针 列表 的 结构 体 。 在 类 中 准备 一 个 这 样 的 vtb1I， 并 使 得 实例 可 以 访问 
这 个 vtbl， 就 实现 了 类 的 方法 。 

CLOS ( Common Lisp Object System ) 和 基于 类 实现 的 继承 不 同 ， 有 多 方法 multi- 
method )、 类 似 JavaScript 的 基于 原型 ( prototype base ) 的 对 象 等 实现 。 
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也 几乎 没有 讲述 如 何 实现 面向 对 象 编程 语言 的 图 书 。 


未 局 所 过 内 坟 从 力 监 修 ， 青 木 峰 郎 ，「 Ruby 一 又 汪 一 上 完全 解说 」( Ruby 源码 分 析 ), f 
LZwvA, 2002 
基于 实际 的 源 代码 讲述 了 Ruby 的 面向 对 象 特 性 的 实现 。 
Andrew W. Appel, Modern Compiler Implementation in ML, Cambridge University 
Press, 1997 

简单 涉及 了 面向 对 象 编程 语言 的 实现 。 


函数 式 语言 

函数 式 语言 ( functional programming language ) 是 最 近 非 常 受 关注 的 一 个 编程 语言 派系 。 
事实 上 并 不 存在 “函数 式 语 言 ” 这 样 严谨 的 分 类 ， 但 大 家 基本 上 都 可 以 接受 将 Haskell, ML, 
Erlang 归 为 函数 式 语言 ， 将 Common Lisp 和 Scheme 也 姑且 归 为 函数 式 语 言 。 

在 笔者 看 来 ， 函 数 式 语言 最 近 备 受 关注 的 原因 有 两 点 : 一 是 其 通过 原则 上 禁止 副作用 实现 
了 很 高 的 安全 性 和 强大 的 优化 ; 二 是 因为 细 粒 度 的 并 行 处 理 良好 ， 有 利于 充分 利用 不 断 增 加 的 
CPU 内 核 ， 这 一 点 和 最 近 人 硬件 的 发 展 方向 相 匹 配 。 

关于 函数 式 语言 的 实现 ， 推 荐 下 面 这 本 图 书 。 







































































Andrew W. Appel, Modern Compiler Implementation in ML, Cambridge University 
Press, 1997 

中 涉及 了 闭 包 ( closure ) 的 实现 、 尾 递归 优化 ( tail recursion optimization )、 懒 评价 ( lazy 
evaluation ) 的 实现 等 内 容 。 








d 








可 供 参 考 的 源 代 码 有 Objective Caml, GHC ( Grasgow Haskell Compiler ) 等 。 
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e “Intel64 and IA-32 Intel Architectures Software Developer's Manual" 
http://www.intel.com/products/processor/manuals/ 

e “AMD64 Architecture Programmer 's Manual" 
http://developer.amd.com/documentation/guides/Pages/default.aspx 

e “Linux Standard Base Core Specification for IA32 3.2" 
http://www.linuxfoundation.org/en/Specifications 
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Edition 
http://www.sco.com/developers/devspecs/ 

e "System V Application Binary Interface: AMD64 Architecture Processor Supplement" 
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e “Documentation for binutils 2.18" 
http://sourceware.org/binutils/docs-2.18/ 

e “Mac OS X ABI Function Call Guide" 
http://developer.apple.com/documentation/DeveloperTools/Conceptual/LowLevelA BI/000- 
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源 代 码 








GNU Compiler Collection 4.3.0 http://gcc.gnu.org/ 

GNU Binutils 2.18 http://www.gnu.org/software/binutils/ 
GNU C Library 2.7 http://www.gnu.org/software/libc/ 
Coins 1.3.2.2 http://www.coins-project.org/ 

Ruby 开发 版 HEAD http://www.ruby-lang.org/ 





ee 个 精简 版 C 语 言 编译 器 ， 让 读者 深入 了 解 C 语 言 
译 、 运 行 背 后 的 细节 。 








全 面 不 仅 限 于 编译 器 ， 对 以 编译 器 为 中 心 的 编程 语言 的 运行 环境 ， 即 编 
译 器 、 汇 编 器 、 链 接 器 、 硬 件 以 及 运行 时 环境 等 ， 均 有 所 涉及 。 


Pica ci dig 青木 峰 郎 耗 时 3 年 精心 打造 ， 通 过 具体 的 例子 讲 


权威 通俗 易 懂 ， 更 适合 入 门 。 
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